字節(jié)跳動(dòng)近日正式推出了其最新的豆包大模型1.5 Pro版本,這一消息引起了業(yè)界的廣泛關(guān)注。據(jù)悉,該模型在知識(shí)、代碼、推理以及中文等多個(gè)關(guān)鍵測(cè)評(píng)領(lǐng)域,均展現(xiàn)出了超越GPT-4o、Claude 3.5 Sonnet等競(jìng)爭(zhēng)對(duì)手的實(shí)力。
目前,豆包大模型1.5 Pro已在豆包App中開始灰度測(cè)試,與此同時(shí),開發(fā)者也可以通過(guò)火山引擎直接調(diào)用其API接口,這為更多應(yīng)用場(chǎng)景的開發(fā)提供了便利。
豆包大模型1.5 Pro之所以能夠在性能上取得如此顯著的突破,得益于其采用了創(chuàng)新的預(yù)訓(xùn)練方法和大規(guī)模稀疏MoE架構(gòu)。字節(jié)跳動(dòng)官方透露,該模型使用了較小的激活參數(shù)進(jìn)行預(yù)訓(xùn)練,卻能夠等效于7倍激活參數(shù)的Dense模型性能,這一效率遠(yuǎn)超業(yè)內(nèi)MoE架構(gòu)的常規(guī)水平。
除了豆包大模型1.5 Pro之外,字節(jié)跳動(dòng)還同時(shí)發(fā)布了新版豆包視覺(jué)理解模型Doubao-1.5-vision-pro和豆包實(shí)時(shí)語(yǔ)音模型Doubao-1.5-realtime-voice-pro。其中,Doubao-1.5-vision-pro在多模態(tài)數(shù)據(jù)合成、動(dòng)態(tài)分辨率、多模態(tài)對(duì)齊以及混合訓(xùn)練等方面進(jìn)行了全面升級(jí),進(jìn)一步提升了其在視覺(jué)推理、文字文檔識(shí)別、細(xì)粒度信息理解以及指令遵循等方面的能力。
豆包實(shí)時(shí)語(yǔ)音模型Doubao-1.5-realtime-voice-pro已經(jīng)實(shí)現(xiàn)了端到端的語(yǔ)音對(duì)話功能,具備低時(shí)延、對(duì)話中可隨時(shí)打斷等特性,這一創(chuàng)新使得用戶體驗(yàn)得到了顯著提升。目前,該模型已在豆包App中全量開放,用戶只需將豆包App升級(jí)至7.2.0版本即可體驗(yàn)。
另外,字節(jié)跳動(dòng)官方還表示,豆包大模型1.5 Pro及其全系列產(chǎn)品,包括Doubao-1.5-pro、Doubao-1.5-lite以及Doubao-1.5-vision-pro等,在訓(xùn)練過(guò)程中均未使用任何其他模型生成的數(shù)據(jù),這保證了模型的獨(dú)立性和原創(chuàng)性。
更令人驚喜的是,盡管豆包大模型1.5 Pro在性能和功能上都有了顯著提升,但其價(jià)格卻保持不變,真正做到了“加量不加價(jià)”。這一舉措無(wú)疑將進(jìn)一步提升豆包大模型的市場(chǎng)競(jìng)爭(zhēng)力,為更多用戶帶來(lái)更加優(yōu)質(zhì)、高效的智能服務(wù)體驗(yàn)。