馬斯克的人工智能新創(chuàng)公司xAI近日震撼發(fā)布Grok 3大模型升級(jí)版,他親自贊譽(yù)其為“地球智商巔峰的人工智能”。
據(jù)悉,Grok 3是在20萬塊英偉達(dá)高性能芯片的強(qiáng)大算力下訓(xùn)練而成,運(yùn)算效能較上一代躍升十倍。在xAI的直播活動(dòng)中,馬斯克攜手三位工程師現(xiàn)場(chǎng)演示,Grok 3在數(shù)學(xué)、科學(xué)及編程基準(zhǔn)測(cè)試中,力壓群雄,包括谷歌的Gemini、DeepSeek的V3模型、Anthropic的Claude及OpenAI的GPT-4。
馬斯克透露,Grok 3的訓(xùn)練基于海量合成數(shù)據(jù),通過不斷校驗(yàn)數(shù)據(jù)以確保邏輯一致性,并能自主識(shí)別并剔除錯(cuò)誤數(shù)據(jù)。從目前的測(cè)試結(jié)果來看,Grok 3在AIME'24數(shù)學(xué)能力、GPQA科學(xué)知識(shí)評(píng)估及LCB Oct-Feb編程能力測(cè)試中,均超越DeepSeek,具備“思維鏈”推理機(jī)制,能逐步拆解復(fù)雜任務(wù),參數(shù)量高達(dá)萬億級(jí)別。
盡管Grok 3在復(fù)雜邏輯和推理任務(wù)中表現(xiàn)卓越,但其在數(shù)學(xué)和編程領(lǐng)域的高分并未與競(jìng)爭(zhēng)對(duì)手拉開顯著差距。DeepSeek則在中文理解和多模態(tài)交互方面展現(xiàn)穩(wěn)定優(yōu)勢(shì),已在多個(gè)實(shí)際應(yīng)用場(chǎng)景中獲驗(yàn)證。更令人矚目的是,Grok 3的成本極其高昂,計(jì)算量是前代Grok 2的十倍,訓(xùn)練成本據(jù)傳高達(dá)30億美元,xAI旗下的超算中心算力已實(shí)現(xiàn)翻倍。
回顧去年4月,馬斯克為打造頂尖AI,決定自建數(shù)據(jù)中心。在緊迫的時(shí)間線下,團(tuán)隊(duì)僅用122天便啟動(dòng)首批10萬個(gè)GPU,而要實(shí)現(xiàn)理想中的AI則需將集群規(guī)模翻倍。發(fā)布會(huì)上透露,團(tuán)隊(duì)僅用92天便實(shí)現(xiàn)超算集群算力翻倍,GPU數(shù)量已達(dá)20萬塊。以英偉達(dá)H100為例,僅硬件采購成本便高達(dá)60億美元,加上配套設(shè)備,總成本或達(dá)百億美元量級(jí)。
相比之下,DeepSeek的訓(xùn)練成本僅為600萬美元,遠(yuǎn)低于GPT-4的7800萬美元。若DeepSeek在資金、人才和資源上持續(xù)增強(qiáng),其綜合能力有望與Grok 3比肩。Grok 3的發(fā)布,實(shí)際上凸顯了DeepSeek的強(qiáng)大實(shí)力。馬斯克通過巨額投資堆砌算力,但成果與OpenAI相差無幾,而DeepSeek以低成本路線與之抗衡,展現(xiàn)出不凡實(shí)力。
這不僅是兩種不同路線的較量,更是算力資源分配主導(dǎo)權(quán)的爭(zhēng)奪。美國(guó)通過控制GPU芯片出口,精準(zhǔn)調(diào)控全球AI生產(chǎn)力,將全球劃分為三個(gè)算力等級(jí)圈。特朗普投資的“星際之門”計(jì)劃,更是旨在將AI領(lǐng)先鎖定在美國(guó)本土,吸引全球資金,綁定其他國(guó)家于美國(guó)的AI戰(zhàn)車。而DeepSeek打破了這一主導(dǎo),為其他國(guó)家提供了自主發(fā)展AI的希望,其以低成本實(shí)現(xiàn)OpenAI模型同等性能,降低了對(duì)美國(guó)高算力GPU芯片的依賴。