亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

馬斯克Grok 3模型亮相,能否超越DeepSeek成AI新標(biāo)桿?

   時(shí)間:2025-02-19 00:46 來(lái)源:差評(píng)XPIN作者:顧雨柔

在科技界的聚光燈下,AI領(lǐng)域的競(jìng)爭(zhēng)再次被推向了新的高潮。就在近日,由科技巨頭馬斯克預(yù)告的“地球上最聰明的人工智能”——Grok 3,終于揭開(kāi)神秘面紗,震撼登場(chǎng)。

發(fā)布會(huì)依舊延續(xù)了馬斯克一貫的風(fēng)格,雖然預(yù)告了十二點(diǎn)準(zhǔn)時(shí)開(kāi)始,但觀眾們還是耐心等待了近二十分鐘。在這場(chǎng)長(zhǎng)達(dá)一個(gè)小時(shí)的直播中,馬斯克攜手xAI天團(tuán)(其中不乏華人面孔),全方位展示了Grok 3的強(qiáng)大實(shí)力。從紙面數(shù)據(jù)來(lái)看,它無(wú)疑超越了包括谷歌、OpenAI和DeepSeek在內(nèi)的眾多明星公司的招牌模型。

不僅如此,網(wǎng)絡(luò)上還流傳著一段由AI生成的奧特曼看到Grok 3發(fā)布后的視頻,趣味橫生,從側(cè)面反映了公眾對(duì)這款新AI模型的期待與好奇。

國(guó)內(nèi)外關(guān)于Grok 3的報(bào)道鋪天蓋地,諸如“首個(gè)突破1400分(模型在Imarena.ai競(jìng)技場(chǎng)的得分)的模型”、“首個(gè)十萬(wàn)卡集群訓(xùn)練出來(lái)的模型”等頭銜,讓人不禁對(duì)其刮目相看。世超也觀看了這場(chǎng)發(fā)布會(huì),雖然不能說(shuō)震撼到炸裂,但Grok 3確實(shí)再次延續(xù)了AI領(lǐng)域“大力出奇跡”的神話。

目前,Grok 3僅對(duì)部分X的Premium+會(huì)員開(kāi)放。從發(fā)布會(huì)的內(nèi)容來(lái)看,Grok 3的實(shí)力不容小覷。一開(kāi)始,xAI就將Grok與GPT的模型迭代速度進(jìn)行了對(duì)比,針對(duì)性十足。

在模型性能方面,Grok 3更是展現(xiàn)出了與其他模型一爭(zhēng)高下的決心。此次發(fā)布的Grok 3實(shí)際上是一個(gè)模型家族,包括非推理模型和推理模型兩種。非推理模型中的Grok 3和Grok 3 mini,在AIME ’24數(shù)學(xué)競(jìng)賽、GPQA(研究生水平科學(xué)知識(shí)問(wèn)答能力的基準(zhǔn)測(cè)試)和代碼三項(xiàng)測(cè)試中,成績(jī)遙遙領(lǐng)先其他模型。

而在Chatbot Arena的盲測(cè)中,Grok 3的早期版本“巧克力”更是以史無(wú)前例的1400分高居榜首,在整體風(fēng)格控制、編碼、數(shù)學(xué)和創(chuàng)意寫(xiě)作等多個(gè)方面均表現(xiàn)出色。

再來(lái)看Grok 3的推理模型。在當(dāng)前的AI市場(chǎng)中,推理模型已成為各家競(jìng)爭(zhēng)的焦點(diǎn)。Grok 3 Reasoning Beta和Grok 3 mini Reasoning也不負(fù)眾望,展現(xiàn)出了強(qiáng)大的實(shí)力。雖然在某些測(cè)試中,如果不考慮加時(shí)賽(即給模型更多思考時(shí)間),Grok 3的推理模型與其他模型的差距并不明顯,但一旦加上加時(shí)賽,其優(yōu)勢(shì)便立刻顯現(xiàn)出來(lái)。

現(xiàn)場(chǎng)演示中,馬斯克團(tuán)隊(duì)展示了Grok 3推理模型在2025年AIME數(shù)學(xué)競(jìng)賽上的測(cè)試結(jié)果,并生成了3D動(dòng)畫(huà)代碼和游戲設(shè)計(jì)案例。這些演示不僅證明了Grok 3的強(qiáng)大實(shí)力,還讓人聯(lián)想到馬斯克昨天宣布的xAI將成立AI游戲工作室的消息。如果Grok 3的游戲制作能力真的如此強(qiáng)大,那么它將對(duì)整個(gè)游戲圈產(chǎn)生深遠(yuǎn)影響。

馬斯克還透露,Grok 3在未來(lái)的兩到三年內(nèi)可能參與到特斯拉的生產(chǎn)和火箭發(fā)射過(guò)程中?;贕rok 3構(gòu)建的智能搜索引擎Deepsearch也備受矚目,它能夠?yàn)g覽網(wǎng)頁(yè)、驗(yàn)證信源并給出準(zhǔn)確答案。

然而,盡管Grok 3看上去如此強(qiáng)大,但也有一些用戶分享的實(shí)際測(cè)試案例與宣傳不符。一些測(cè)試顯示,在某些情況下,o3 mini的表現(xiàn)甚至優(yōu)于Grok 3。同時(shí),也有網(wǎng)友指出了發(fā)布會(huì)演示案例中的明顯錯(cuò)誤。

盡管存在這些爭(zhēng)議,但不可否認(rèn)的是,Grok 3的發(fā)布再次證明了算力在AI領(lǐng)域的重要性。馬斯克團(tuán)隊(duì)在短短不到一年的時(shí)間里,通過(guò)搭建10萬(wàn)卡乃至20萬(wàn)卡的集群,成功訓(xùn)練出了這款強(qiáng)大的AI模型。Grok 3的出現(xiàn)無(wú)疑為AI領(lǐng)域帶來(lái)了新的挑戰(zhàn)和機(jī)遇。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容