滾動資訊

當前位置：網(wǎng)界 > 數(shù)據(jù)洞察 > 正文內(nèi)容

Cerebras AI芯片因DeepSeek服務需求激增，大語言模型推理成新熱點

時間：2025-02-12 19:23 來源：ITBEAR作者：任飛揚

AI芯片巨頭Cerebras近期遭遇了一場前所未有的挑戰(zhàn)，其CEO Andrew Feldman在一次訪談中透露，公司正被大量運行DeepSeek-R1大語言模型的訂單淹沒。

Cerebras，這家以推出高性能AI晶圓級芯片著稱的公司，其單塊芯片便能提供驚人的125 PFLOPS峰值算力，并搭配高達1.2PB的內(nèi)存容量，一直以來都是AI領域的佼佼者。然而，這次DeepSeek-R1的火爆需求，顯然超出了他們的預期。

DeepSeek-R1，這款被視作AI領域分水嶺的模型，其預訓練成本僅為GPTo1等主流模型的十分之一，但效果卻與之相近甚至更佳。Feldman表示，DeepSeek不僅在當前展現(xiàn)出了巨大影響力，更將推動更大規(guī)模AI系統(tǒng)的誕生。隨著成本的降低，AI市場的潛力正在被不斷挖掘。

在Cerebras的官方展示中，其晶圓級AI芯片在部署DeepSeek-R1 70B時，性能達到了1508 tokens/s，遠超GPU。然而，這款模型在推理過程中，卻需要消耗大量算力。由于采用了Chain-of-thought（CoT）方法增強推理能力，模型需要將多步問題分解為中間步驟，并在需要時執(zhí)行額外計算。這種逐字推理的方式，對于整段提示詞的推理需要多次進行，從而導致了算力的巨大需求。

面對這一痛點，Cerebras提出了利用蒸餾技術將大模型的“知識”轉移到小模型中的解決方案。大模型被稱為教師模型，而較小的模型則被稱為學生模型。通過這種方式，客戶可以在保持模型精度的同時，降低推理過程中的算力需求。

Cerebras在官網(wǎng)上表示，DeepSeek R1在蒸餾到Llama 70B后，精度幾乎沒有下降。為了改善用戶體驗，Cerebras為客戶提供了一種標準做法：利用開源在Hugging Face上的DeepSeek模型參數(shù)作為教師模型，蒸餾出一個較小的學生模型用于實際部署。

Feldman強調(diào)，DeepSeek作為首個頂級的開源推理模型，是開源AI的重大勝利。通過蒸餾技術，開源模型只需公開模型參數(shù)，研究人員無需訪問源碼便能復制新AI模型的進步。他認為，DeepSeek的經(jīng)濟性不僅震撼了整個AI行業(yè)，更將吸引更多投資流向尖端AI芯片和網(wǎng)絡技術。

盡管有些人擔心計算成本的下降會導致市場萎縮，但Feldman指出，過去50年的歷史表明，降低成本反而能夠擴大市場容量。無論是電腦還是智能手機，價格的降低都推動了產(chǎn)品的普及。因此，他相信DeepSeek和Cerebras的推動將進一步加速AI市場的增長。

自去年8月開始提供公共推理服務以來，Cerebras自稱是“世界上最快的人工智能推理服務提供商”。然而，面對高昂的405B模型成本，該公司目前主要提供的是蒸餾后的70B模型。Feldman表示，雖然有一部分客戶愿意為更高的準確性支付更高的成本，但大多數(shù)客戶更傾向于選擇價格實惠的模型。

更多>同類內(nèi)容

《哪吒之魔童鬧?！啡騽赢嬰娪捌狈科?3億，成TOP4唯一非好萊塢作品

02-12

北京迎來航天新紀元：八家重點實驗室攜前沿技術扎堆落戶

02-12

佳士得AI作品拍賣引眾怒，3000藝術家聯(lián)名抗議：AI剝削何時止？

02-12

中海地產(chǎn)：行業(yè)波動中穩(wěn)健前行，如何實現(xiàn)逆勢增長？

02-12

教輔圖書市場逆勢增長，新勢力如何圍獵傳統(tǒng)巨頭？

02-12

寧德時代2024動力電池全球裝車量領跑，市占率突破37.9%！

02-12

OPPO Find X8系列6.3英寸版命名曝光，非“mini”另有新稱！

02-12

何小鵬與任正非交流心得：科技、企業(yè)治理獲真知灼見

02-12

《美國隊長4：美麗新世界》票房預測下調(diào)，能否續(xù)寫超級英雄傳奇？

02-12

巴西中南地區(qū)糖產(chǎn)量未來兩年預計增長8.5%，出口量亦將上升

02-12

OPPO A3i Plus新機來襲！主打抗摔耐磨，2月14日見真章

02-12

宇華教育：從并購狂潮到賣校償債，資金鏈困局何解？

02-12

微信“藍包”送禮功能：人情世故背后的電商新戰(zhàn)場？

02-12

本土商超崛起，能否孵化出下一個“瑞士卷”傳奇？

02-12

老鋪黃金狂飆背后：消費幻覺能否撐起“新茅臺”神話？

02-12

點擊查看更多 +

全站最新

《哪吒之魔童鬧?！啡騽赢嬰娪捌狈科?3億，成TOP4唯一非好萊塢作品

vivo OriginOS深度融合滿血版DeepSeek，藍心小V將獲深度思考新技能

阿維塔07 Pro+搭華為智駕2月18日上市，性價比如何？

佳士得AI作品拍賣引眾怒，3000藝術家聯(lián)名抗議：AI剝削何時止？

理想L6累計交付21萬輛，增程式電動車與中大型SUV銷量雙冠王！

《黑神話：悟空》攜手名創(chuàng)優(yōu)品MINISO，共創(chuàng)IP聯(lián)名新篇章！

熱門內(nèi)容

本欄最新

佳士得AI作品拍賣引眾怒，3000藝術家聯(lián)名抗議：AI剝削何時止？

教輔圖書市場逆勢增長，新勢力如何圍獵傳統(tǒng)巨頭？

寧德時代2024動力電池全球裝車量領跑，市占率突破37.9%！

OPPO Find X8系列6.3英寸版命名曝光，非“mini”另有新稱！

何小鵬與任正非交流心得：科技、企業(yè)治理獲真知灼見

《美國隊長4：美麗新世界》票房預測下調(diào)，能否續(xù)寫超級英雄傳奇？

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標，是該商標的唯一持有者，未經(jīng)授本公司授權，嚴禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

Cerebras AI芯片因DeepSeek服務需求激增，大語言模型推理成新熱點

Cerebras AI芯片因DeepSeek服務需求激增，大語言模型推理成新熱點