滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 數(shù)碼極客 > 正文內(nèi)容

DeepSeek連發(fā)大招：開源優(yōu)化策略，英偉達(dá)R1模型推理速度飆升25倍

時(shí)間：2025-02-27 15:44 作者：陸辰風(fēng)

近期，人工智能領(lǐng)域迎來(lái)了一系列重要進(jìn)展，其中DeepSeek公司的動(dòng)作尤為引人注目。該公司宣布了一項(xiàng)重大決定——將其優(yōu)化并行策略（Optimized Parallelism Strategies）進(jìn)行開源，這一策略旨在提升計(jì)算效率，減少資源浪費(fèi)，并最大化系統(tǒng)性能。

據(jù)DeepSeek介紹，該優(yōu)化并行策略是一套精心設(shè)計(jì)的并行計(jì)算方案，適用于多核、分布式或異構(gòu)系統(tǒng)。它通過(guò)合理分配任務(wù)、協(xié)調(diào)資源利用以及減少通信開銷，實(shí)現(xiàn)了高效并行執(zhí)行，為人工智能模型的訓(xùn)練和推理提供了強(qiáng)有力的支持。

不僅如此，DeepSeek還宣布了其另一項(xiàng)重要成果——與英偉達(dá)合作，在Blackwell架構(gòu)上優(yōu)化的DeepSeek-R1模型。這一新模型在推理速度上實(shí)現(xiàn)了25倍的提升，同時(shí)每token成本降低了20倍，標(biāo)志著英偉達(dá)在人工智能領(lǐng)域的又一次重大突破。

DeepSeek的開源行動(dòng)并未止步于此。在此之前，該公司已經(jīng)將DeepEP向公眾開放，這一Expert Parallelism通信基礎(chǔ)專為MoE模型的訓(xùn)練和推理而設(shè)計(jì)。DeepEP能夠?qū)崿F(xiàn)高效優(yōu)化的全到全通信，支持低精度計(jì)算，并對(duì)非對(duì)稱帶寬轉(zhuǎn)發(fā)場(chǎng)景進(jìn)行了深度優(yōu)化，從而在訓(xùn)練和推理任務(wù)中展現(xiàn)出卓越的性能。

為了進(jìn)一步提升用戶體驗(yàn)，DeepSeek還推出了錯(cuò)峰優(yōu)惠活動(dòng)。在北京時(shí)間每日00:30至08:30的夜間空閑時(shí)段，DeepSeek開放平臺(tái)的API調(diào)用價(jià)格大幅下調(diào)，DeepSeek-V3降至原價(jià)的50%，DeepSeek-R1更是降至25%。DeepSeek鼓勵(lì)用戶充分利用這一時(shí)段，享受更經(jīng)濟(jì)、更流暢的服務(wù)。

此次優(yōu)惠活動(dòng)正值DeepSeek的“開源周”。在這一周內(nèi)，DeepSeek連續(xù)開源了多個(gè)重要代碼庫(kù)。首個(gè)開源的是針對(duì)Hopper GPU優(yōu)化的FlashMLA，隨后是用于MoE模型訓(xùn)練和推理的開源EP通信庫(kù)DeepEP，以及一個(gè)支持密集和MoE GEMM的FP8 GEMM庫(kù)，為V3/R1的訓(xùn)練和推理提供了有力支持。

英偉達(dá)也在這一領(lǐng)域取得了顯著進(jìn)展。通過(guò)應(yīng)用TensorRT DeepSeek優(yōu)化，英偉達(dá)在Blackwell架構(gòu)上實(shí)現(xiàn)了具有FP4生產(chǎn)級(jí)精度的模型，該模型在MMLU通用智能基準(zhǔn)測(cè)試中達(dá)到了FP8模型性能的99.8%。目前，英偉達(dá)基于FP4優(yōu)化的DeepSeek-R1檢查點(diǎn)已經(jīng)在Hugging Face上開源，用戶可以通過(guò)相關(guān)鏈接訪問(wèn)這一模型。

在后訓(xùn)練量化方面，DeepSeek也取得了重要突破。該模型將Transformer模塊內(nèi)的線性算子的權(quán)重和激活量化到了FP4，適用于TensorRT-LLM推理。這一優(yōu)化不僅減少了每個(gè)參數(shù)的位數(shù)，從8位降低到4位，還使得磁碟空間和GPU顯存的需求減少了約1.6倍，為人工智能模型的部署和應(yīng)用提供了更加經(jīng)濟(jì)、高效的選擇。

更多>同類內(nèi)容

GDC2025：EA揭秘死亡空間與鋼鐵俠游戲紋理創(chuàng)新技術(shù)

03-11

索尼開發(fā)AI游戲角色原型：埃洛伊能與玩家實(shí)時(shí)對(duì)話互動(dòng)

03-11

AMD銳龍9 5900XT低調(diào)上市：16核Zen3架構(gòu)，性能如何？

03-11

何小鵬：人形機(jī)器人產(chǎn)業(yè)深耕5年，未來(lái)或再投500億，L3級(jí)量產(chǎn)指日可待？

03-11

Win11 Copilot新版上線：Alt+空格喚醒語(yǔ)音助手，交互體驗(yàn)再升級(jí)！

03-11

尼康Z50II攜手云創(chuàng)：定格生活美好，開啟創(chuàng)意攝影新篇章

03-11

AI賦能直播！00后主播DeepSeek助力一日銷售額破3億，跟風(fēng)浪潮起

03-11

2025中國(guó)職場(chǎng)女性月薪近九千，職業(yè)探索意愿超男性引關(guān)注

03-11

華為MatePad系列新平板，鴻蒙NEXT Beta版招募開啟，你準(zhǔn)備好了嗎？

03-11

東南大學(xué)率先上線阿里QwQ-32B模型，消費(fèi)級(jí)顯卡即可本地部署！

03-11

微信安卓8.0.57內(nèi)測(cè)版來(lái)襲！有哪些新變化等你來(lái)發(fā)現(xiàn)？

03-10

蘋果海外高級(jí)訂閱解鎖新功能：輕松邀好友，獨(dú)享美食頻道

03-10

零跑B10預(yù)售火爆，1小時(shí)訂單破萬(wàn)，朱江明稱史上之最！

03-10

廣東力推AI與機(jī)器人產(chǎn)業(yè)創(chuàng)新：整合產(chǎn)業(yè)鏈資源，打造全球創(chuàng)新高地

03-10

極摩客AD-GP1外置獨(dú)顯來(lái)襲：Oculink接口+AMD RX 7600M XT，性能如何？

03-10

點(diǎn)擊查看更多 +

全站最新

蘋果Apple One高級(jí)訂閱海外升級(jí)，新增“邀請(qǐng)”與“美食”兩大特權(quán)

微信安卓8.0.57測(cè)試版來(lái)襲！主要優(yōu)化哪些已知問(wèn)題？

小米人形機(jī)器人CyberOne量產(chǎn)計(jì)劃是謠言？官方這樣說(shuō)

微信朋友圈大升級(jí)：5分鐘長(zhǎng)視頻隨心分享！

GDC2025：EA揭秘死亡空間與鋼鐵俠游戲紋理創(chuàng)新技術(shù)

企業(yè)應(yīng)對(duì)職場(chǎng)“內(nèi)卷”：強(qiáng)制下班，以人為本的新策略？

熱門內(nèi)容

本欄最新

GDC2025：EA揭秘死亡空間與鋼鐵俠游戲紋理創(chuàng)新技術(shù)

索尼開發(fā)AI游戲角色原型：埃洛伊能與玩家實(shí)時(shí)對(duì)話互動(dòng)

AMD銳龍9 5900XT低調(diào)上市：16核Zen3架構(gòu)，性能如何？

何小鵬：人形機(jī)器人產(chǎn)業(yè)深耕5年，未來(lái)或再投500億，L3級(jí)量產(chǎn)指日可待？

Win11 Copilot新版上線：Alt+空格喚醒語(yǔ)音助手，交互體驗(yàn)再升級(jí)！

尼康Z50II攜手云創(chuàng)：定格生活美好，開啟創(chuàng)意攝影新篇章

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

DeepSeek連發(fā)大招：開源優(yōu)化策略，英偉達(dá)R1模型推理速度飆升25倍

DeepSeek連發(fā)大招：開源優(yōu)化策略，英偉達(dá)R1模型推理速度飆升25倍