近日,中國創(chuàng)業(yè)公司DeepSeek因其在人工智能領(lǐng)域的巨額投入引發(fā)了廣泛關(guān)注和股市波動。據(jù)知名研究機(jī)構(gòu)SemiAnalysis的最新報告揭示,DeepSeek在硬件繪圖處理器(GPU)上的支出已超過5億美元大關(guān)。
DeepSeek的背后推手是中國對沖基金幻方量化(High-Flyer)。據(jù)悉,幻方量化于2023年5月正式成立了DeepSeek,旨在加速AI技術(shù)的研發(fā)進(jìn)程。值得注意的是,早在2021年,即任何出口管制措施生效之前,幻方量化已前瞻性地投資購入了一萬顆英偉達(dá)(Nvidia)A100 GPU,為DeepSeek的后續(xù)發(fā)展奠定了堅實基礎(chǔ)。
SemiAnalysis的報告進(jìn)一步指出,DeepSeek在GPU方面的投資之巨,遠(yuǎn)超公眾想象。而英偉達(dá)方面,為了遵守相關(guān)法規(guī),已推出了多款H100的變種產(chǎn)品,如H800、H20等。然而,目前僅有H20型號被允許銷售至中國市場。在過去九個月里,英偉達(dá)專門為中國市場生產(chǎn)了超過百萬顆H20 GPU。據(jù)分析,DeepSeek在服務(wù)器資本支出(CapEx)方面的總投入已接近16億美元。
DeepSeek不僅在硬件上投入巨大,同時在人才引進(jìn)方面也動作頻頻。公司從中國本土招募了大量優(yōu)秀人才,目前團(tuán)隊規(guī)模已迅速擴(kuò)張至約150人。近期,DeepSeek因模型訓(xùn)練成本低于600萬美元的說法而引發(fā)業(yè)界熱議。然而,SemiAnalysis的報告強(qiáng)調(diào),這600萬美元僅指預(yù)訓(xùn)練運(yùn)行的GPU成本,遠(yuǎn)非模型總成本的全部。研發(fā)(R&D)、硬件總擁有成本(Total Cost of Ownership)等關(guān)鍵因素均未計入其中。
報告還提及了DeepSeek獲得大量算力資源與出口管制及時間滯后效應(yīng)之間的關(guān)聯(lián)。美國智庫蘭德公司(RAND)研究員海姆(Lennart Heim)近期分析指出,硬件出口管制存在時間滯后,其影響力尚未完全顯現(xiàn)。未來,當(dāng)數(shù)據(jù)中心需要升級或擴(kuò)展時,美國企業(yè)將相對容易應(yīng)對,而對于受出口管制影響的中國企業(yè)來說,這將是一個嚴(yán)峻挑戰(zhàn)。
盡管面臨諸多挑戰(zhàn),DeepSeek在人工智能領(lǐng)域的表現(xiàn)卻令人矚目。SemiAnalysis評價稱,DeepSeek開放的權(quán)重模型在性能上超越了meta的Llama、法國人工智能創(chuàng)業(yè)公司Mistral AI等競爭對手,展現(xiàn)出強(qiáng)大的競爭力。
DeepSeek的成功不僅體現(xiàn)在技術(shù)上,更在于其對于未來趨勢的敏銳洞察和果斷行動。面對出口管制等外部壓力,DeepSeek通過提前布局、加大投入等策略,確保了自身在人工智能領(lǐng)域的領(lǐng)先地位。