近日,AI訓練數(shù)據(jù)解決方案提供商海天瑞聲發(fā)布了其2024年度的業(yè)績快報,數(shù)據(jù)亮眼,引發(fā)業(yè)界廣泛關注。
據(jù)快報顯示,海天瑞聲在過去一年中實現(xiàn)了營業(yè)收入2.37億元,與前一年相比增長了39.46%,這一成績無疑為其在AI數(shù)據(jù)服務領域的地位增添了重量。同時,公司的歸母凈利潤達到了1121.5萬元,成功實現(xiàn)了同比扭虧為盈,這一轉變無疑為投資者和市場帶來了極大的信心。
海天瑞聲自2005年成立以來,一直專注于為AI企業(yè)和研發(fā)機構提供高質量的數(shù)據(jù)集及服務。其客戶群體涵蓋了阿里巴巴、騰訊、字節(jié)跳動等國際國內知名科技巨頭,以及微軟、亞馬遜等全球科技領導企業(yè)。憑借多年的積累和技術實力,海天瑞聲在AI數(shù)據(jù)服務領域樹立了良好的口碑。
談及營收增長的原因,海天瑞聲表示,這主要得益于大模型技術的快速發(fā)展以及應用場景的不斷拓展。隨著智能終端廠商和科技互聯(lián)網(wǎng)公司的崛起,這些科技巨頭們紛紛加大了對多模態(tài)數(shù)據(jù)的投入,以支撐其在智能終端、內容生成等領域的AI能力建設。在此背景下,海天瑞聲所提供的多語種、多音色智能語音業(yè)務,以及指令微調、偏好對齊等自然語言業(yè)務需求呈現(xiàn)出了大幅增長的趨勢。
海天瑞聲還提到了DeepSeek模型對數(shù)據(jù)需求的影響。據(jù)該公司透露,DeepSeek-V3模型在預訓練階段所使用的token數(shù)量遠超GPT4等同類大模型,這進一步凸顯了海量、高質量數(shù)據(jù)對于基礎模型能力提升的重要性。海天瑞聲認為,DeepSeek模型的出現(xiàn)將有助于推動AI模型向產業(yè)端發(fā)展,而這一過程中將需要更多的數(shù)據(jù)以及數(shù)據(jù)專家的參與。
值得注意的是,海天瑞聲在智能化標注方面也取得了顯著的進展。該公司表示,隨著AI大模型的快速發(fā)展,數(shù)據(jù)服務行業(yè)對智能化標注的要求和需求不斷提升。為此,海天瑞聲已經在多數(shù)場景下引入了智能化標注技術,通過算法進行預先標注,實現(xiàn)了高效的人機協(xié)同。這一技術的應用不僅提高了標注效率,也進一步提升了數(shù)據(jù)的質量。
為了滿足日益增長的市場需求,海天瑞聲還進一步擴大了其AI相關業(yè)務規(guī)模。近日,河北省數(shù)海數(shù)據(jù)科技有限公司正式成立,該公司由海天瑞聲等共同持股,經營范圍涵蓋了人工智能應用軟件開發(fā)、人工智能基礎軟件開發(fā)以及人工智能理論與算法軟件開發(fā)等多個領域。這一舉措無疑為海天瑞聲的未來發(fā)展注入了新的動力。