近期,DeepSeek的火爆表現(xiàn)無疑為資本市場注入了一劑強心針,激發(fā)了投資者對AI+產(chǎn)業(yè)鏈的熱情。在2月5日開工首日,DeepSeek概念指數(shù)飆升14.73%,AI應(yīng)用端和科技板塊全線上漲,而2月6日早盤,A股TMT科技板塊繼續(xù)保持強勁勢頭,DeepSeek與AI算力概念尤為活躍。
就在這一片欣欣向榮之際,中國大模型市場又傳來重大消息:百度智能云成功激活昆侖芯三代萬卡集群,成為國內(nèi)首個正式投入使用的自研萬卡集群。上線首日,已有超過1.5萬家客戶通過千帆平臺調(diào)用該模型。這一里程碑式的事件不僅標志著百度在自研芯片與大規(guī)模AI算力布局上取得了新的突破,更預示著AI模型訓練成本的大幅下降,為整個行業(yè)的發(fā)展注入了新的活力。
隨著各大科技巨頭紛紛加速推進AI算力基礎(chǔ)設(shè)施建設(shè),萬卡集群成為了業(yè)界關(guān)注的焦點。那么,萬卡集群究竟是什么?為何各大企業(yè)都在積極自建自研萬卡集群?國產(chǎn)萬卡集群的不斷演進又將如何改變智算產(chǎn)業(yè)的面貌?
近年來,AI大模型如雨后春筍般涌現(xiàn),模型規(guī)模和數(shù)據(jù)參數(shù)呈指數(shù)級增長。例如,從2018年GPT-1的1.17億參數(shù)量,到2020年GPT-3的1750億參數(shù)量,再到2023年GPT-4的約1.8萬億參數(shù)量,參數(shù)的快速增長極大地提升了AI模型的性能。然而,這也導致AI模型訓練的算力需求每3.5個月翻一番,每年所需算力增幅高達10倍,遠遠超出了摩爾定律的增速。
以GPT-4為例,其訓練過程使用了約25000個英偉達的A100 GPU,持續(xù)時間長達90至100天,算力消耗巨大。隨著大模型越來越多地應(yīng)用于企業(yè)實際業(yè)務(wù)場景,后期推理的算力需求也隨之增加。因此,大規(guī)模GPU算力集群成為必然選擇,國內(nèi)外科技廠商紛紛布局AI算力基礎(chǔ)設(shè)施,致力于搭建萬卡甚至10萬卡集群。
“萬卡集群”即由超過一萬張加速卡(如GPU、TPU等)組成的高性能計算系統(tǒng),用于加速AI模型的訓練和推理過程。與訓練周期長、成本高的傳統(tǒng)千億參數(shù)模型相比,萬卡集群在計算能力、數(shù)據(jù)處理速度和存儲容量等方面實現(xiàn)了質(zhì)的飛躍。通過并行計算和分布式處理,萬卡集群能夠顯著縮短模型訓練周期,提高研發(fā)效率。
作為一種靈活的計算基礎(chǔ)設(shè)施,萬卡集群能夠根據(jù)應(yīng)用需求進行定制化配置和優(yōu)化,支持更大規(guī)模模型和更復雜的多模態(tài)任務(wù),為AI技術(shù)的創(chuàng)新和發(fā)展提供了更廣闊的空間。同時,萬卡集群通過提升算力利用率和簡化用戶部署流程,降低了AI技術(shù)的使用門檻,推動了其在各領(lǐng)域的廣泛應(yīng)用。
然而,萬卡集群的搭建并非易事。要想建設(shè)萬卡集群規(guī)模的算力中心,需面臨算力使用效率、海量數(shù)據(jù)處理、多芯混訓難題、智算中心設(shè)計以及穩(wěn)定性與運維等多重挑戰(zhàn)。這些挑戰(zhàn)需要運用系統(tǒng)工程方法、精細化設(shè)計網(wǎng)絡(luò)和軟硬件整合優(yōu)化等技術(shù)手段來解決。
百度智能云此次成功點亮萬卡集群,得益于其在硬件和軟件方面的技術(shù)創(chuàng)新。硬件層面,自研昆侖芯三代在算力、能效、穩(wěn)定性等方面全面升級,突破了卡間互聯(lián)拓撲限制,并采用創(chuàng)新性散熱方案,確保集群高效穩(wěn)定運行。軟件層面,百舸AI異構(gòu)計算平臺4.0在構(gòu)建高性能網(wǎng)絡(luò)、優(yōu)化分布式訓練、多芯混訓和故障診斷等方面發(fā)揮了關(guān)鍵作用。
百度智能云依托百舸AI異構(gòu)計算平臺4.0,實現(xiàn)了從集群創(chuàng)建到開發(fā)實驗、模型訓練、推理的全鏈路優(yōu)化,不僅提升了自身的智算實力,也為智算行業(yè)提供了新的發(fā)展思路。憑借自研昆侖芯的技術(shù)優(yōu)勢和百舸平臺的有力加持,百度智能云已為眾多企業(yè)提供了高效、穩(wěn)定、混合多芯的AI基礎(chǔ)設(shè)施。
例如,生數(shù)科技依托百度百舸的能力,在短時間內(nèi)完成了Vidu大模型的上線和開放API,素材渲染加速效率提升3倍,數(shù)據(jù)拉取效率提升51倍。長安汽車通過與百度智能云的深度合作,自動駕駛模型訓練的算力總體平均使用率提升到90%以上,綜合資源利用率提升了50%。教育場景先行者好未來教育集團則借助百舸平臺自研出“九章大模型(MathGPT)”,已廣泛應(yīng)用于智能硬件、學而思旗艦學習機等多個業(yè)務(wù)場景中。
百度智能云自研萬卡集群的成功點亮,不僅在國內(nèi)引發(fā)廣泛關(guān)注,也在國際市場掀起熱議?;ㄆ煦y行在研報中指出,百度、DeepSeek等中國模型的高效和低成本優(yōu)勢,將有助于加速全球AI應(yīng)用開發(fā),推動2025年人工智能應(yīng)用的拐點。百度在港股、美股的雙雙上漲,也印證了這一點。
對于科技公司來說,擁有強大的萬卡集群意味著在AI時代奠定了堅實的基礎(chǔ)和競爭力。萬卡集群的建設(shè)不僅反映了企業(yè)在技術(shù)水平、資金投入和戰(zhàn)略規(guī)劃上的決策和能力,還能提升其在行業(yè)中的聲譽和影響力,吸引更多的人才、合作伙伴和資金,形成良好的產(chǎn)業(yè)生態(tài),為企業(yè)的持續(xù)發(fā)展提供堅實支持。