在北京時間的某個晴朗午后,科技界迎來了一則震撼人心的消息:馬斯克麾下的AI創(chuàng)新企業(yè)xAI,正式揭曉了其傾力打造的最新一代人工智能大語言模型——Grok-3。這一發(fā)布,標志著人工智能領(lǐng)域又邁出了歷史性的一步。
作為xAI的第三代力作,Grok-3在發(fā)布前便已被馬斯克冠以“地球上最聰慧的人工智能”之美譽。在最新的基準測試中,Grok-3與DeepSeek-V3、GPT-4o、Gemini-2 Pro及Claude 3.5 Sonnet等業(yè)界翹楚同臺競技,展現(xiàn)出了壓倒性的優(yōu)勢。xAI還同步推出了基于Grok-3的智能搜索引擎Deepsearch,進一步拓寬了其應(yīng)用場景。
在基準測試中,Grok-3的表現(xiàn)尤為搶眼。無論是在數(shù)學能力、科學知識評估,還是在編程能力測試中,Grok-3均取得了令人矚目的高分。具體而言,其數(shù)學能力測試得分52分,科學知識評估得分75分,編程能力測試得分57分,均遠超競爭對手。這一連串的亮眼成績,無疑為Grok-3贏得了業(yè)界的廣泛認可。
尤為在最新公布的AIME 2025性能測試中,Grok-3 Reasoning Beta版本在推理和計算時間復合評分上更是斬獲了93分的高分,遙遙領(lǐng)先于DeepSeek-R1的75分,以及OpenAI最新推出的推理模型o3 mini的87分。這一成績,充分展示了Grok-3在復雜數(shù)學推理和計算效率方面的卓越能力。
盡管Grok-3的推理模型目前仍處于Beta測試階段,且仍在持續(xù)訓練中,但xAI團隊對其未來充滿信心。在發(fā)布會上,馬斯克攜手三位團隊成員,詳細介紹了Grok-3的特性和優(yōu)勢,并現(xiàn)場進行了演示。演示中,當被問及如何設(shè)計火星移民基地的能源系統(tǒng)時,Grok-3并未直接給出答案,而是采用了“思維鏈”技術(shù),逐步分析問題、拆解任務(wù),最終整合得出全面而詳細的解決方案。這一過程,與人類思考和推理的方式極為相似,令人嘆為觀止。
Grok-3之所以能夠取得如此顯著的進步,離不開馬斯克為訓練AI集群而打造的超級計算集群Colossus。這個由10萬塊英偉達GPU組成的龐然大物,單日耗電量堪比一座小型核電站,為Grok-3的訓練提供了強大的算力支持。據(jù)悉,Grok-3使用了10萬個英偉達H100 GPU,提供了長達2億個GPU小時的訓練時間,比其前代Grok-2快了整整十倍。
然而,在Grok-3大放異彩的同時,馬斯克與OpenAI之間的恩怨糾葛也再次浮出水面。近日,馬斯克正式向加州聯(lián)邦法院提交了974億美元全現(xiàn)金收購OpenAI的意向書,但遭到了OpenAI首席執(zhí)行官山姆·奧特曼的堅決拒絕。奧特曼在社交媒體上嘲諷道:“如果你愿意的話,我們可以用97.4億美元收購推特(現(xiàn)在的X)?!边@一事件,再次引發(fā)了業(yè)界對馬斯克與OpenAI之間關(guān)系的廣泛討論。
盡管如此,OpenAI在商業(yè)化方面的探索并未因此受阻。2024年底,OpenAI發(fā)表聲明稱董事會正在評估其公司結(jié)構(gòu),未來將繼續(xù)保持非營利性組織和營利性組織并存的狀態(tài)。這也意味著,OpenAI的營利化轉(zhuǎn)型即將完成,非營利組織將逐漸剝離。對此,馬斯克律師致信加州和特拉華州總檢察長,要求對OpenAI進行公開競標,以確保非營利組織在剝離資產(chǎn)時獲得公允補償。