近期,社交媒體巨頭meta宣布了一項重大技術進展:其正在測試一款自研芯片,旨在優(yōu)化人工智能系統(tǒng)的訓練過程。這款芯片標志著meta在減少對外部供應商依賴、推進定制化芯片設計方面邁出了決定性步伐。
據(jù)知情人士透露,meta已開始小規(guī)模部署這款自研芯片,并計劃根據(jù)測試結果逐步擴大生產(chǎn)規(guī)模,以實現(xiàn)更廣泛的應用。這一舉措是meta長期戰(zhàn)略的一部分,旨在降低基礎設施成本,特別是在人工智能領域的支出。
據(jù)了解,meta在2025年的預計總支出將達到1140億至1190億美元,其中高達650億美元將用于人工智能基礎設施建設。這款新訓練芯片作為專用加速器,專注于處理人工智能任務,相較于傳統(tǒng)的集成圖形處理單元(GPU),在能效方面展現(xiàn)出顯著優(yōu)勢。
meta與中國臺灣地區(qū)的芯片制造商臺積電合作生產(chǎn)這款自研芯片。目前,該芯片已完成首次“流片”,標志著從設計到生產(chǎn)的重要里程碑。然而,流片過程充滿挑戰(zhàn),不僅成本高昂,且耗時三至六個月,且成功率并非百分之百。若測試失敗,meta需重新診斷問題并進行流片。
盡管meta在自研芯片領域曾遭遇挫折,甚至一度放棄了一款類似開發(fā)階段的芯片,但公司并未放棄努力。去年,meta已在其推薦系統(tǒng)中成功部署了一款自研推理芯片,用于運行Facebook和Instagram新聞推送中的人工智能系統(tǒng)。meta高管表示,他們計劃從2026年開始使用自研芯片進行訓練,以應對計算密集型任務。
meta首席產(chǎn)品官克里斯·考克斯在近期的一次會議上表示,公司正在研究如何為推薦系統(tǒng)進行訓練,并逐步探索生成式人工智能的訓練和推理。他形容meta的芯片開發(fā)工作為“從爬行到行走再到奔跑”的過程,并指出第一代推理芯片取得了巨大成功。
然而,meta的自研芯片之路并非一帆風順。此前,一款自研推理芯片在測試部署中失敗,導致相關項目暫停。2022年,meta轉向英偉達,訂購了價值數(shù)十億美元的GPU。盡管meta一直保持作為英偉達的最大客戶之一,但近期隨著人工智能領域對大型語言模型“擴展”潛力的質(zhì)疑,這些GPU的價值開始受到挑戰(zhàn)。