近日,科技界迎來(lái)了一場(chǎng)震撼人心的發(fā)布活動(dòng)。北京時(shí)間2月18日中午,埃隆·馬斯克攜其xAI團(tuán)隊(duì)的三位核心成員,通過(guò)一場(chǎng)視頻直播,向全球推出了他們最新的語(yǔ)言大模型——Grok 3。馬斯克自信地宣稱,這款人工智能是“地球上最聰明”的存在。
盡管外界對(duì)Grok 3的成熟度持有一定的保留意見(jiàn),認(rèn)為它可能仍帶有半成品的痕跡,但其所展現(xiàn)的性能數(shù)據(jù)無(wú)疑在業(yè)界,特別是科技愛(ài)好者群體中引起了巨大轟動(dòng)。發(fā)布會(huì)后,A股市場(chǎng)上,連續(xù)數(shù)周受到熱炒的DeepSeek概念高位股出現(xiàn)了大幅下跌,仿佛預(yù)示著新時(shí)代的到來(lái)。
在隨機(jī)LLM“陷阱”測(cè)試中,Grok 3的表現(xiàn)同樣值得關(guān)注。它能夠正確回答一些對(duì)人類(lèi)簡(jiǎn)單但對(duì)LLM困難的問(wèn)題,如“strawberry”中有幾個(gè)“r”等。然而,在幽默感和復(fù)雜倫理問(wèn)題方面,Grok 3似乎仍有待提高。例如,在生成笑話方面,Grok 3的表現(xiàn)并不出色,而且它對(duì)某些復(fù)雜倫理問(wèn)題的回答也顯得過(guò)于謹(jǐn)慎。