近期,科技界迎來(lái)了一則震撼人心的消息:馬斯克AI公司正式揭曉了其最新研發(fā)的人工智能基座大模型——Grok 3。這一發(fā)布在直播間內(nèi)引發(fā)了全球范圍內(nèi)的廣泛關(guān)注與熱議。
在萬(wàn)眾矚目的發(fā)布會(huì)上,馬斯克親自站臺(tái),向全球觀眾展示了Grok 3的卓越性能。據(jù)透露,與前代Grok 2相比,Grok 3的計(jì)算能力實(shí)現(xiàn)了質(zhì)的飛躍,提升了整整10倍以上。這一驚人的提升背后,是20萬(wàn)張英偉達(dá)GPU的龐大算力支持。這一改變使得Grok 3在處理大型數(shù)據(jù)集時(shí)游刃有余,不僅顯著縮短了模型訓(xùn)練時(shí)間,更在預(yù)測(cè)準(zhǔn)確性和效率上邁上了新臺(tái)階。馬斯克甚至豪言,未來(lái)Grok 3將在SpaceX的火星任務(wù)中大放異彩,并在三年內(nèi)助力實(shí)現(xiàn)諾貝爾獎(jiǎng)級(jí)別的科學(xué)突破。
早在發(fā)布會(huì)前夕,馬斯克就在社交媒體上預(yù)熱稱(chēng),Grok 3具備極強(qiáng)的推理能力,在各項(xiàng)測(cè)試中均表現(xiàn)出色,超越了所有已知已發(fā)布的人工智能產(chǎn)品。他毫不吝嗇地贊譽(yù)Grok 3為“地球上最聰明的人工智能”。
馬斯克AI公司的xAI團(tuán)隊(duì)也披露了Grok 3的一些詳細(xì)數(shù)據(jù)。盡管起步相對(duì)較晚,但Grok 3在MMLU得分上卻以驚人的速度追趕上了業(yè)界標(biāo)桿ChatGPT。不僅如此,Grok 3及其迷你版Grok 3 mini在多方面性能上都超越了Gemini、DeepSeek和ChatGPT等競(jìng)爭(zhēng)對(duì)手,展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。
然而,就在發(fā)布會(huì)后,有媒體對(duì)Beta版的Grok 3進(jìn)行了測(cè)試,并發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象。當(dāng)被問(wèn)及“9.11與9.9哪個(gè)大?”這一看似簡(jiǎn)單的問(wèn)題時(shí),Grok 3卻未能給出正確答案。相比之下,另一款人工智能模型DeepSeek無(wú)論是在普通模式下還是開(kāi)啟深度思考模式后,都準(zhǔn)確無(wú)誤地回答了這一問(wèn)題。
大模型,作為近年來(lái)人工智能領(lǐng)域的熱門(mén)話題,是指包含超大規(guī)模參數(shù)(通常在十億個(gè)以上)的神經(jīng)網(wǎng)絡(luò)模型。這些模型受到人腦神經(jīng)系統(tǒng)結(jié)構(gòu)的啟發(fā),由人工神經(jīng)元(節(jié)點(diǎn))和連接組成,通過(guò)調(diào)整連接的權(quán)重來(lái)學(xué)習(xí)和適應(yīng)數(shù)據(jù)模式。據(jù)數(shù)據(jù)顯示,全球大模型行業(yè)市場(chǎng)規(guī)模持續(xù)增長(zhǎng),2023年已經(jīng)達(dá)到了210億美元。
在全球范圍內(nèi),大模型行業(yè)的發(fā)展如火如荼。美國(guó)企業(yè)在這一領(lǐng)域占據(jù)領(lǐng)先地位,OpenAI、Google、微軟等企業(yè)主導(dǎo)著生成式AI、自然語(yǔ)言處理等技術(shù)的發(fā)展,其推出的GPT系列和PaLM等模型已經(jīng)得到了廣泛應(yīng)用。而在中國(guó),大模型技術(shù)同樣備受關(guān)注。中國(guó)工程院院士柴洪峰在某次大會(huì)上強(qiáng)調(diào),大模型技術(shù)是時(shí)代發(fā)展的必然趨勢(shì),任何對(duì)其漠視都將錯(cuò)失未來(lái)的發(fā)展機(jī)遇。他呼吁業(yè)內(nèi)人士積極擁抱大模型技術(shù),共同推動(dòng)產(chǎn)業(yè)的發(fā)展與變革,并警惕大模型帶來(lái)的數(shù)據(jù)隱私、算法透明性等潛在風(fēng)險(xiǎn)。
清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松也指出,大模型能夠顯著提升工作效率和效果,這是其備受推崇的重要原因之一。在處理數(shù)據(jù)體量龐大、具有高度復(fù)雜性和重復(fù)性的任務(wù)時(shí),大模型展現(xiàn)出了無(wú)可比擬的優(yōu)勢(shì)。大量耗費(fèi)人力和時(shí)間的工作,如果落在了大模型能力可覆蓋的范圍內(nèi),將能夠借助大模型快速完成。