在萬眾矚目中,馬斯克攜其最新力作Grok 3震撼登場,這款產(chǎn)品的預告以“聰明得可怕”一詞迅速在網(wǎng)絡上發(fā)酵,引發(fā)了全球范圍內(nèi)的熱烈討論與期待。
發(fā)布會前夕,App Store悄然更新了Grok應用,而發(fā)布會進行中,Grok的網(wǎng)頁版更是因訪問量激增而一度陷入癱瘓,這無疑為即將揭曉的新品增添了幾分神秘色彩。
Grok 3的問世,絕非一次簡單的產(chǎn)品迭代。馬斯克為此投入巨資,建設了數(shù)據(jù)中心,配備了頂級的顯卡配置,并采用最優(yōu)的預訓練模型,結合強化學習進行訓練,堪稱是“富養(yǎng)”出來的新一代AI產(chǎn)品。
此次發(fā)布會亮點頻出:美區(qū)賬號已率先更新,英區(qū)及歐洲地區(qū)將于2月28日推出;同時,Grok推出了名為SuperGrok的高級訂閱計劃,月費30美元,年費300美元,提供額外的推理功能和DeepSearch查詢服務,以及無限量的圖像生成服務。據(jù)稱,Grok 3的推理能力已超越DeepSeek R1,在LMSYS盲測中,Grok 3在代碼、指令響應等多個方面均拔得頭籌。
作為20萬張顯卡的結晶,Grok 3的卓越表現(xiàn)再次印證了Scaling Law的有效性。與DeepSeek的低成本高效益策略不同,Grok 3走的是“大力出奇跡”的路線。
Grok 3的推理能力有了質的飛躍,這得益于其更靈活的實時計算資源分配機制,能夠在保證推理質量的同時,最大化地利用計算資源。Grok 2的推理能力曾達到當時的SOTA水平,而經(jīng)過多次迭代后,Grok 3的泛化能力更是大幅提升,并在最新的AIME競賽中刷新了記錄。
在發(fā)布會上,工程團隊展示了Grok 3的兩大應用場景:一是生成一個從地球發(fā)射至火星并返回的3D動畫代碼,Grok 3僅用了19秒便詳細描述了其思考過程;二是嘗試將《俄羅斯方塊》與《寶石迷陣》結合,創(chuàng)造新游戲,盡管在初次嘗試中遇到了些許波折,但后續(xù)演示中,Grok 3還是展現(xiàn)出了其強大的實力。
而此次更新的重頭戲,無疑是Grok 3加持的DeepSearch功能,它被譽為下一代搜索引擎。DeepSearch能夠像agent一樣自主運作,理解用戶提問背后的意圖,極大地節(jié)省了用戶在傳統(tǒng)搜索引擎上花費的時間。在發(fā)布會現(xiàn)場,工程師向Grok 3提出了一個極具挑戰(zhàn)性的任務:預測NCAA“瘋狂三月”的所有比賽結果。Grok 3不僅給出了詳盡的答案,還通過設計子任務面板,讓用戶能夠實時監(jiān)測任務進度,確保答案的可靠性和可用性。
關于Grok 3的體驗方式,官方表示,X的Premium+訂閱用戶將率先體驗,而其他高級功能則被納入xAI推出的新計劃——SuperGrok中。馬斯克還透露,Grok的語音模式將在未來一周內(nèi)推出,這將是Grok最好的體驗之一。在發(fā)布會尾聲,語音模型展示了一段男聲,雖然只是簡短的路透,但已足以激起人們對語音模式的無限期待。
在發(fā)布會后的問答環(huán)節(jié)中,馬斯克回答了觀眾關于Grok語音模式、API推出時間、Grok能否記住互動談話內(nèi)容、是否開源Grok模型等問題的提問。他透露,Grok將理解人類所說的話,語音模式的早期版本將在一周內(nèi)發(fā)布,并會迅速進行迭代更新;Grok API將在接下來的幾周內(nèi)推出,包含推理模型和深度研究功能;關于是否開源Grok模型,馬斯克表示,當Grok 3成熟穩(wěn)定后,大概幾個月將會開源Grok 2。