特斯拉首席執(zhí)行官埃隆·馬斯克旗下的人工智能企業(yè)xAI,于2月18日正式揭曉了其最新力作——旗艦級(jí)人工智能模型Grok 3,并同步推出了Grok的iOS及Web應(yīng)用新特性。
Grok 3的問世,被視為xAI對(duì)OpenAI GPT-4o及谷歌Gemini等強(qiáng)大競(jìng)爭(zhēng)對(duì)手的直接回應(yīng)。這款模型不僅能夠解析圖像并精準(zhǔn)回答各類問題,還深度融入馬斯克的社交網(wǎng)絡(luò)X,為其多項(xiàng)功能提供堅(jiān)實(shí)的技術(shù)支撐。
據(jù)悉,Grok 3的研發(fā)歷經(jīng)數(shù)月,原計(jì)劃在2024年面世,但最終未能如期而至。位于孟菲斯的xAI數(shù)據(jù)中心,配置了約20萬個(gè)GPU,全力投入到Grok 3的訓(xùn)練之中。馬斯克自豪地表示,Grok 3的計(jì)算效能相較于其前身Grok 2,實(shí)現(xiàn)了“十倍”的飛躍,其訓(xùn)練數(shù)據(jù)集更是廣泛涵蓋了法庭文件等多元信息。
“Grok 3在性能上遠(yuǎn)超Grok 2,它是一款致力于探求真相的人工智能?!瘪R斯克如是說。
實(shí)際上,Grok 3是一個(gè)由多個(gè)模型組成的系列。其中,Grok 3 mini以其快速響應(yīng)見長,盡管在準(zhǔn)確性上略有妥協(xié)。盡管Grok 3系列及其功能尚未完全部署(部分仍處于測(cè)試階段),但自本周起已開始逐步推出。
xAI宣稱,在包括AIME(評(píng)估模型解決數(shù)學(xué)問題能力)和GPQA(以博士級(jí)物理、生物和化學(xué)問題考驗(yàn)?zāi)P停┰趦?nèi)的多項(xiàng)基準(zhǔn)測(cè)試中,Grok 3均超越了GPT-4o。在Chatbot Arena這一眾包測(cè)試中,Grok 3的早期版本也展現(xiàn)出了強(qiáng)勁的競(jìng)爭(zhēng)實(shí)力,讓用戶通過投票選出他們最滿意的答案。
Grok 3系列新增了兩個(gè)專注于邏輯推理的模型——Grok 3 Reasoning與Grok 3 mini Reasoning,它們能夠像OpenAI的o3-mini及中國AI企業(yè)DeepSeek的R1等“推理”模型一樣,深入“思考”問題。
馬斯克透露,Grok應(yīng)用程序即將在不久后增添“語音模式”,為用戶帶來Grok模型的合成語音體驗(yàn)。而Grok 3模型則預(yù)計(jì)將在數(shù)周后通過xAI的企業(yè)API提供服務(wù),并附帶DeepSearch功能。
關(guān)于開源計(jì)劃,xAI表示將在未來數(shù)月內(nèi)開放Grok 2的源代碼。馬斯克解釋稱:“我們的慣例是,在新版本全面發(fā)布時(shí),會(huì)將前一版本的源代碼開放?!彼M(jìn)一步指出,“當(dāng)Grok 3趨于成熟穩(wěn)定,或許就在幾個(gè)月后,我們將開放Grok 2的源代碼?!?/p>