在科技浪潮的洶涌推進(jìn)下,人工智能領(lǐng)域正迎來(lái)前所未有的變革。近期,一則震撼消息傳出,特朗普宣布重啟“星際之門(mén)”項(xiàng)目——Stargate Project,該項(xiàng)目由OpenAI、甲骨文及軟銀等科技巨頭聯(lián)手,計(jì)劃斥資5000億美元,在未來(lái)四年內(nèi)全力打造AI基礎(chǔ)設(shè)施。Arm、微軟、英偉達(dá)等知名企業(yè)也加入其中,共同推動(dòng)這一被譽(yù)為AI領(lǐng)域“曼哈頓計(jì)劃”的壯舉,預(yù)示著人類(lèi)正大步邁向通用人工智能(AGI)的新時(shí)代。
與此同時(shí),在東方大國(guó)中國(guó),AI領(lǐng)域的競(jìng)爭(zhēng)同樣激烈。春節(jié)前夕,國(guó)內(nèi)多家頭部大模型企業(yè)集中發(fā)布了一系列推理模型更新,如DeepSeek的R1、Kimi的k1.5、智譜的GLM-Zero及階躍星辰的Step-1o系列等,它們均瞄準(zhǔn)了OpenAI的GPT系列模型,展現(xiàn)了中國(guó)企業(yè)在AI賽道上的強(qiáng)勁追趕態(tài)勢(shì)。
經(jīng)過(guò)兩年的高強(qiáng)度研發(fā),中國(guó)AI廠商不僅通過(guò)跟隨式創(chuàng)新大幅縮小了與國(guó)際領(lǐng)先水平的差距,更探索出了一條以較少資源實(shí)現(xiàn)高性能的獨(dú)特路徑。如今,中國(guó)AI行業(yè)正處于原創(chuàng)式創(chuàng)新與大規(guī)模商用的臨界點(diǎn),集體智能的涌現(xiàn)標(biāo)志著這一領(lǐng)域的嶄新階段。
尤為值得關(guān)注的是,字節(jié)跳動(dòng)在1月22日正式推出了豆包大模型1.5系列。其中,Doubao-1.5-pro在知識(shí)、代碼、推理等多項(xiàng)權(quán)威測(cè)評(píng)中全面超越GPT-4o和Claude 3.5 Sonnet,達(dá)到了全球頂尖水平。更令人驚喜的是,該模型已集成至火山方舟平臺(tái),提供服務(wù)的同時(shí)價(jià)格保持不變,實(shí)現(xiàn)了性?xún)r(jià)比的極大飛躍。
在過(guò)去的一年里,字節(jié)跳動(dòng)在大模型領(lǐng)域的增長(zhǎng)速度令人咋舌。從年初被外界質(zhì)疑入局時(shí)機(jī)過(guò)晚,到年末取得的一系列輝煌成就,字節(jié)跳動(dòng)的轉(zhuǎn)型之路堪稱(chēng)“深思熟慮后的迅速行動(dòng)”的典范。數(shù)據(jù)顯示,截至2024年12月,豆包APP的月活躍用戶(hù)已達(dá)7523萬(wàn),日均Tokens使用量超過(guò)4萬(wàn)億。豆包大模型與火山引擎的組合,成功打破了B端企業(yè)市場(chǎng)和云計(jì)算的傳統(tǒng)格局。
此次發(fā)布的豆包大模型1.5系列,涵蓋了多個(gè)版本以滿足不同需求。Doubao-1.5-pro以滿血性能支持256k長(zhǎng)文本,在多項(xiàng)測(cè)試中得分優(yōu)于業(yè)界一流模型;Doubao-1.5-lite則以輕量級(jí)成本提供旗艦級(jí)性能,響應(yīng)速度極快;Doubao-1.5-vision-pro在視覺(jué)理解方面全面升級(jí),能夠處理多模態(tài)數(shù)據(jù);Doubao-1.5-realtime-voice-pro則實(shí)現(xiàn)了端到端的語(yǔ)音對(duì)話功能,并在豆包APP全面上線。
Doubao-1.5-pro在多個(gè)權(quán)威測(cè)評(píng)基準(zhǔn)上均取得了優(yōu)異成績(jī),無(wú)論是處理中文文本、搜索專(zhuān)業(yè)知識(shí)、編程開(kāi)發(fā)還是復(fù)雜邏輯推理任務(wù),都游刃有余。實(shí)測(cè)中,該模型迅速解答了復(fù)雜的邏輯推理題,并創(chuàng)作了一篇包含多次反轉(zhuǎn)的懸疑短篇小說(shuō),充分展示了其強(qiáng)大的通用智能。
而輕量級(jí)的Doubao-1.5-lite在性能上與去年9月的豆包Pro版本相當(dāng),這意味著企業(yè)客戶(hù)能夠以更低的成本獲得更出色的性能。多模態(tài)能力的全面提升,使得豆包在交互和智能表現(xiàn)上更加貼近人類(lèi)。
視覺(jué)理解模型Doubao-1.5-vision-pro在多模態(tài)數(shù)據(jù)合成、動(dòng)態(tài)分辨率等方面進(jìn)行了全面升級(jí),能夠讀懂任意分辨率和比例的圖片,甚至能夠識(shí)別并判分手寫(xiě)的試卷。同時(shí),豆包APP已全面上線實(shí)時(shí)語(yǔ)音功能,支持多種有趣的互動(dòng)方式,為用戶(hù)帶來(lái)更加豐富的體驗(yàn)。
字節(jié)跳動(dòng)在AI領(lǐng)域的快速發(fā)展,不僅體現(xiàn)在技術(shù)層面的突破,更在于其精準(zhǔn)的市場(chǎng)戰(zhàn)略。從C端市場(chǎng)破局,推出覆蓋聊天、視頻、編程等多領(lǐng)域的AI應(yīng)用,迅速積累了龐大的用戶(hù)基礎(chǔ)。在B端市場(chǎng),通過(guò)極致優(yōu)化的模型推理成本,成功打入企業(yè)市場(chǎng),提升了火山引擎在云服務(wù)市場(chǎng)的地位?;鹕揭孀プ 按竽P?云廠商”的機(jī)遇,推出了包括火山方舟、扣子、HiAgent等一系列平臺(tái)和服務(wù),為企業(yè)落地大模型、打造AI應(yīng)用提供了全方位的支持。
截至2024年12月中旬,豆包大模型的日均Token使用量已超過(guò)4萬(wàn)億,已在金融、消費(fèi)、電商等多個(gè)行業(yè)完成落地,與八成主流汽車(chē)品牌達(dá)成合作,并接入到多家智能終端,覆蓋設(shè)備約3億臺(tái)。隨著大模型廠商的分化逐漸明朗,能夠繼續(xù)迭代基礎(chǔ)模型并有望實(shí)現(xiàn)商業(yè)化盈利的廠商數(shù)量有限。對(duì)字節(jié)跳動(dòng)而言,豆包大模型1.5 Pro的頂尖表現(xiàn)、C端產(chǎn)品的龐大用戶(hù)基礎(chǔ)以及火山引擎在B端業(yè)務(wù)的突破,為其在AI時(shí)代奠定了堅(jiān)實(shí)的基礎(chǔ)。