埃隆·馬斯克的人工智能企業(yè)xAI近日震撼發(fā)布了其最新力作——Grok 3大模型,這一創(chuàng)新成果被馬斯克自豪地譽(yù)為“地球智慧之巔”的人工智能存在。
在一場(chǎng)別開生面的直播活動(dòng)中,馬斯克攜手三位工程師,通過一系列現(xiàn)場(chǎng)演示,向全球觀眾展示了Grok 3的非凡實(shí)力。在數(shù)學(xué)、科學(xué)以及編程等領(lǐng)域的基準(zhǔn)測(cè)試中,Grok 3力壓群雄,包括谷歌的Gemini、DeepSeek的V3和R1模型、Anthropic的Claude,以及OpenAI的GPT-4o,均敗下陣來。
尤為引人注目的是,在Chatbot Arena這一匯聚眾包智慧的開放平臺(tái)上,Grok 3以超過1400分的優(yōu)異成績(jī),一舉成為該平臺(tái)有史以來得分最高的模型,再次證明了其無與倫比的智能水平。
xAI還宣布了一項(xiàng)重大進(jìn)展——推出基于Grok 3的智能搜索引擎Deepsearch。盡管名字與近期備受矚目的Deepseek有所相似,但Deepsearch憑借其強(qiáng)大的Grok 3內(nèi)核,無疑將在搜索領(lǐng)域掀起新的波瀾。
馬斯克在直播中深入闡述了Grok 3的核心優(yōu)勢(shì),強(qiáng)調(diào)其通過數(shù)據(jù)反復(fù)校驗(yàn)與邏輯一致性追求,有效減少了AI幻覺現(xiàn)象。同時(shí),他也透露了Grok 3背后驚人的算力支持——得益于耗時(shí)8個(gè)月打造的Colossus超級(jí)計(jì)算機(jī),該計(jì)算機(jī)配備了10萬個(gè)英偉達(dá)的H100 GPU,為Grok 3的訓(xùn)練提供了高達(dá)2億個(gè)GPU小時(shí)的計(jì)算資源,是Grok 2的十多倍。
回顧xAI的發(fā)展歷程,自2023年7月成立以來,便以驚人的速度推進(jìn)技術(shù)創(chuàng)新。同年11月,xAI推出了首款大模型Grok-1,憑借3140億參數(shù)的龐大規(guī)模,迅速成為當(dāng)時(shí)參數(shù)量最大的開源大語言模型。而2024年8月發(fā)布的Grok-2,更是在性能上與ChatGPT的最新模型不相伯仲。這一系列大模型均具備聯(lián)網(wǎng)獲取實(shí)時(shí)信息的能力,能夠?yàn)g覽并使用X平臺(tái)(原推特)上的資訊,確保了信息獲取的時(shí)效性。
然而,隨著DeepSeek等中國大模型的崛起,業(yè)界也開始重新審視“大規(guī)模堆芯片和算力”這一傳統(tǒng)AI發(fā)展路徑的必要性。OpenAI首席執(zhí)行官奧爾特曼甚至表示,DeepSeek的出現(xiàn)已經(jīng)縮小了OpenAI的領(lǐng)先優(yōu)勢(shì),并反思了OpenAI在開源模型和研究成果上的策略,暗示未來可能需要采取更為開放的策略來應(yīng)對(duì)挑戰(zhàn)。