滾動資訊

當(dāng)前位置：網(wǎng)界 > 產(chǎn)業(yè)經(jīng)濟(jì) > 正文內(nèi)容

中美AI大模型路線之爭：馬斯克力大磚飛，梁文鋒降本增效誰將勝出？

時間：2025-02-21 18:20 來源：新京報作者：顧雨柔

近日，AI領(lǐng)域迎來了兩大重要進(jìn)展。一方面，埃隆·馬斯克旗下的xAI公司發(fā)布了名為Grok3的大型語言模型，憑借在多項測試中的卓越表現(xiàn)，迅速登頂大模型測評榜。另一方面，DeepSeek與Kimi團(tuán)隊則分別發(fā)布了兩篇關(guān)于如何降低長文本計算量、提升訓(xùn)練效率的論文，聚焦于AI技術(shù)的降本增效。

Grok3的發(fā)布無疑是AI界的一大震撼。據(jù)馬斯克介紹，該模型采用了20萬張英偉達(dá)H100芯片進(jìn)行訓(xùn)練，性能強(qiáng)勁。在直播發(fā)布會上，xAI展示了其新建的數(shù)據(jù)中心，強(qiáng)調(diào)了大型算力集群對于智能提升的重要性。Grok3在大模型競技場Chatbot Arena中的得分刷新了記錄，凸顯了其技術(shù)實力。這一成就不僅證明了“尺度定律”的有效性，也進(jìn)一步提振了市場對算力供應(yīng)商的信心，英偉達(dá)股價隨之企穩(wěn)回升。

然而，馬斯克并未提及Grok3的開源計劃。盡管他曾表示將在發(fā)布下一代模型后開源上一代模型，但Grok3目前依然是閉源的。這一做法與DeepSeek形成了鮮明對比。自DeepSeek爆火以來，其始終堅持開源模式，將技術(shù)研究免費分享給全球用戶。近日，DeepSeek更是宣布將在未來一周內(nèi)開源5個代碼庫，以完全透明的方式分享其進(jìn)展。

在DeepSeek發(fā)布的論文中，提出了一種名為NSA的原生稀疏注意力機(jī)制。該機(jī)制通過壓縮、選擇和滑動的方式處理輸入序列，減少了計算量，同時保持了模型性能。據(jù)DeepSeek介紹，NSA在基準(zhǔn)測試中的得分優(yōu)于傳統(tǒng)全注意力模型，且計算速度顯著提高。這一成果得到了業(yè)界的廣泛認(rèn)可，包括原谷歌頂級工程師Lucas Beyer在內(nèi)的多位專家都給予了高度評價。

與此同時，Kimi團(tuán)隊也發(fā)布了一篇類似的論文，介紹了一種名為MoBA的塊狀混合注意力機(jī)制。該機(jī)制同樣通過分割長文本并動態(tài)選擇塊的相關(guān)性來提高計算效率。值得注意的是，DeepSeek和Kimi的這兩篇論文都強(qiáng)調(diào)了可以無縫集成到現(xiàn)有語言模型中，無需重新訓(xùn)練，這為現(xiàn)有大模型的加速提供了直接可行的方案。

面對DeepSeek和Kimi在降本增效方面的努力，馬斯克及其xAI團(tuán)隊似乎并未受到影響。他們依然堅持通過擴(kuò)大算力規(guī)模來提升模型性能。然而，這種做法也引發(fā)了業(yè)界對于性價比的討論。有觀點認(rèn)為，盡管算力擴(kuò)張能夠帶來性能提升，但高昂的成本并非所有企業(yè)都能承受。相比之下，DeepSeek的開源模式更有助于推動AI技術(shù)的普及和發(fā)展。

盡管Grok3目前是閉源的，但xAI近期宣布將免費提供Grok3的服務(wù)，直到服務(wù)器崩潰為止。這一舉措或許能夠吸引更多用戶體驗其強(qiáng)大的功能，但長遠(yuǎn)來看，開源模式仍然是推動AI技術(shù)發(fā)展的重要力量。DeepSeek的持續(xù)開源不僅有助于降低技術(shù)門檻，還能夠促進(jìn)全球范圍內(nèi)的技術(shù)創(chuàng)新和合作。

在AI技術(shù)日新月異的今天，中美兩國的大模型發(fā)展路徑呈現(xiàn)出明顯的差異。美國企業(yè)更傾向于通過擴(kuò)大算力規(guī)模來提升性能，而中國企業(yè)則更加注重降本增效和開源共享。這兩種路徑各有優(yōu)劣，但最終的目標(biāo)都是推動AI技術(shù)的普及和發(fā)展。未來，隨著技術(shù)的不斷進(jìn)步和應(yīng)用的不斷拓展，中美兩國在AI領(lǐng)域的競爭與合作將更加激烈。

更多>同類內(nèi)容

高端冰淇淋遇冷，市場洗牌下何去何從？

02-21

GAMDIAS CHIONE P5水冷新品：帶屏設(shè)計，鏡面燈效與隱藏布線亮點十足

02-21

空客CEO傅里：中國商飛或成飛機(jī)制造業(yè)新巨頭，行業(yè)或?qū)⑷愣αⅲ?/a>

02-21

上汽華為強(qiáng)強(qiáng)聯(lián)手，智選車模式引領(lǐng)智能汽車新時代！

02-21

阿里超預(yù)期財報背后：裁員近2.5萬人淘天增長乏力

02-21

鴻海研究院量子計算新突破：資源冗余問題不再制約大規(guī)模量子計算？

02-21

汽車之家換帥楊嵩：海爾入股不裁員，共謀汽車生態(tài)平臺新篇章

02-21

匯豐大裁員波及全球，美洲投行主管疑已離職

02-21

科創(chuàng)50ETF大舉贖回，中芯國際遭減持，市場分歧何在？

02-21

特斯拉儲能“鯰魚效應(yīng)”顯現(xiàn)，中國儲能企業(yè)何去何從？

02-21

雅詩蘭黛業(yè)績連跌，巨頭自救之路能否走出困境？

02-21

文和友廣州店撤場，超級網(wǎng)紅餐飲品牌如何走出長沙困境？

02-21

激光雷達(dá)企業(yè)圖達(dá)通：全民智駕時代下的虧損困境何時破？

02-21

蘋果iPhone 17或受關(guān)稅影響漲價，消費者該何去何從？

02-21

《和平精英》攜手DeepSeek，數(shù)字代言人“吉莉”將獲AI加持！

02-21

點擊查看更多 +

全站最新

董明珠強(qiáng)化個人IP，格力“去格力化”改名風(fēng)暴引熱議

郵儲銀行高層大調(diào)整，鄭國雨正式接任董事長一職

B站Z+世代助力，四季度盈利大增，成功打破盈利魔咒？

OPPO打山寨機(jī)又申OPHONE商標(biāo)，能否擺脫“蘋果模仿者”標(biāo)簽？

蘋果重拾廉價牌，iPhone 16e能否成為銷量新引擎？