亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財經(jīng)媒體
科技·商業(yè)·財經(jīng)

中美AI大模型路線之爭:馬斯克力大磚飛,梁文鋒降本增效誰將勝出?

   時間:2025-02-21 18:20 來源:新京報作者:顧雨柔

近日,AI領(lǐng)域迎來了兩大重要進(jìn)展。一方面,埃隆·馬斯克旗下的xAI公司發(fā)布了名為Grok3的大型語言模型,憑借在多項測試中的卓越表現(xiàn),迅速登頂大模型測評榜。另一方面,DeepSeek與Kimi團(tuán)隊則分別發(fā)布了兩篇關(guān)于如何降低長文本計算量、提升訓(xùn)練效率的論文,聚焦于AI技術(shù)的降本增效。

Grok3的發(fā)布無疑是AI界的一大震撼。據(jù)馬斯克介紹,該模型采用了20萬張英偉達(dá)H100芯片進(jìn)行訓(xùn)練,性能強(qiáng)勁。在直播發(fā)布會上,xAI展示了其新建的數(shù)據(jù)中心,強(qiáng)調(diào)了大型算力集群對于智能提升的重要性。Grok3在大模型競技場Chatbot Arena中的得分刷新了記錄,凸顯了其技術(shù)實力。這一成就不僅證明了“尺度定律”的有效性,也進(jìn)一步提振了市場對算力供應(yīng)商的信心,英偉達(dá)股價隨之企穩(wěn)回升。

然而,馬斯克并未提及Grok3的開源計劃。盡管他曾表示將在發(fā)布下一代模型后開源上一代模型,但Grok3目前依然是閉源的。這一做法與DeepSeek形成了鮮明對比。自DeepSeek爆火以來,其始終堅持開源模式,將技術(shù)研究免費分享給全球用戶。近日,DeepSeek更是宣布將在未來一周內(nèi)開源5個代碼庫,以完全透明的方式分享其進(jìn)展。

在DeepSeek發(fā)布的論文中,提出了一種名為NSA的原生稀疏注意力機(jī)制。該機(jī)制通過壓縮、選擇和滑動的方式處理輸入序列,減少了計算量,同時保持了模型性能。據(jù)DeepSeek介紹,NSA在基準(zhǔn)測試中的得分優(yōu)于傳統(tǒng)全注意力模型,且計算速度顯著提高。這一成果得到了業(yè)界的廣泛認(rèn)可,包括原谷歌頂級工程師Lucas Beyer在內(nèi)的多位專家都給予了高度評價。

與此同時,Kimi團(tuán)隊也發(fā)布了一篇類似的論文,介紹了一種名為MoBA的塊狀混合注意力機(jī)制。該機(jī)制同樣通過分割長文本并動態(tài)選擇塊的相關(guān)性來提高計算效率。值得注意的是,DeepSeek和Kimi的這兩篇論文都強(qiáng)調(diào)了可以無縫集成到現(xiàn)有語言模型中,無需重新訓(xùn)練,這為現(xiàn)有大模型的加速提供了直接可行的方案。

面對DeepSeek和Kimi在降本增效方面的努力,馬斯克及其xAI團(tuán)隊似乎并未受到影響。他們依然堅持通過擴(kuò)大算力規(guī)模來提升模型性能。然而,這種做法也引發(fā)了業(yè)界對于性價比的討論。有觀點認(rèn)為,盡管算力擴(kuò)張能夠帶來性能提升,但高昂的成本并非所有企業(yè)都能承受。相比之下,DeepSeek的開源模式更有助于推動AI技術(shù)的普及和發(fā)展。

盡管Grok3目前是閉源的,但xAI近期宣布將免費提供Grok3的服務(wù),直到服務(wù)器崩潰為止。這一舉措或許能夠吸引更多用戶體驗其強(qiáng)大的功能,但長遠(yuǎn)來看,開源模式仍然是推動AI技術(shù)發(fā)展的重要力量。DeepSeek的持續(xù)開源不僅有助于降低技術(shù)門檻,還能夠促進(jìn)全球范圍內(nèi)的技術(shù)創(chuàng)新和合作。

在AI技術(shù)日新月異的今天,中美兩國的大模型發(fā)展路徑呈現(xiàn)出明顯的差異。美國企業(yè)更傾向于通過擴(kuò)大算力規(guī)模來提升性能,而中國企業(yè)則更加注重降本增效和開源共享。這兩種路徑各有優(yōu)劣,但最終的目標(biāo)都是推動AI技術(shù)的普及和發(fā)展。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用的不斷拓展,中美兩國在AI領(lǐng)域的競爭與合作將更加激烈。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容