滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 智能手機(jī) > 正文內(nèi)容

美團(tuán)DeepSeek R1模型INT8量化版發(fā)布，老顯卡也能暢享高效推理

時(shí)間：2025-03-08 20:13 作者：柳晴雪

美團(tuán)技術(shù)團(tuán)隊(duì)近期取得了一項(xiàng)重要進(jìn)展，成功將DeepSeek R1模型進(jìn)行了INT8精度量化，此舉極大地拓寬了該模型的應(yīng)用場(chǎng)景。

此前，DeepSeek R1模型由于采用FP8數(shù)據(jù)格式的原生權(quán)重，導(dǎo)致其部署范圍受限，僅能在新款英偉達(dá)GPU上運(yùn)行，而像A100這樣的老型號(hào)GPU則無法直接支持。這在一定程度上限制了模型的使用靈活性和推廣范圍。

為了打破這一局限，美團(tuán)搜索和推薦平臺(tái)部門的技術(shù)人員著手對(duì)DeepSeek R1模型進(jìn)行了INT8精度量化嘗試。經(jīng)過不懈努力，他們發(fā)現(xiàn)量化后的模型在保持原有精度的基礎(chǔ)上，成功實(shí)現(xiàn)了在不同型號(hào)GPU上的部署。這意味著，現(xiàn)在DeepSeek R1模型不僅能夠在新款英偉達(dá)GPU上高效運(yùn)行，還能在A100等老型號(hào)GPU上穩(wěn)定工作。

不僅如此，INT8量化還為DeepSeek R1模型帶來了性能上的顯著提升。與BF16相比，INT8量化后的模型在吞吐量方面實(shí)現(xiàn)了50%的增長(zhǎng)，這大大降低了模型的推理成本，提高了整體運(yùn)行效率。

為了讓更多開發(fā)者能夠受益于此項(xiàng)技術(shù)突破，美團(tuán)技術(shù)團(tuán)隊(duì)已經(jīng)將INT8量化的代碼開源發(fā)布在LLM推理框架SGLang上。同時(shí)，量化后的DeepSeek R1模型也被上傳至Hugging Face社區(qū)，供廣大開發(fā)者下載和使用。以下是模型的具體鏈接：

模型鏈接1：https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

模型鏈接2：https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

更多>同類內(nèi)容

企業(yè)應(yīng)對(duì)職場(chǎng)“內(nèi)卷”：強(qiáng)制下班，以人為本的新策略？

03-11

微信朋友圈大升級(jí)：5分鐘長(zhǎng)視頻直接發(fā)，還有哪些新功能你不可不知？

03-11

蘋果2025年將推史上最大軟件革新，統(tǒng)一界面風(fēng)格能否重振銷量？

03-11

吉利銀河翼真L380豪華MPV上市，29.99萬起售，配置豪華令人驚嘆！

03-10

美的強(qiáng)制18點(diǎn)20下班，真的在“反內(nèi)卷”嗎？

03-10

吉利銀河翼真L380陸地空客MPV新上市，豪華配置引領(lǐng)MPV新風(fēng)尚！

03-10

iPhone 17系列真容初現(xiàn)：設(shè)計(jì)大改，eSIM或成新驚喜？

03-10

歐洲央行支付系統(tǒng)故障，數(shù)字歐元計(jì)劃遭遇信任危機(jī)？

03-10

零跑B10預(yù)售開啟，10.98萬起全系智駕，性價(jià)比再創(chuàng)新高！

03-10

美的強(qiáng)制18點(diǎn)20下班，HR催下班反內(nèi)卷？員工：部分事業(yè)部未收到通知

03-10

字節(jié)跳動(dòng)豆包團(tuán)隊(duì)開源MoE技術(shù)，大模型訓(xùn)練效率飆升1.7倍

03-10

糖果大王徐福記易主，徐氏兄弟退出背后的市場(chǎng)變局

03-10

55歲程序員因在項(xiàng)目中植入惡意代碼致公司損失，或?qū)⑷氇z十年

03-10

泰航新規(guī)：3月15日起，充電寶全面禁上飛機(jī)！

03-10

啟辰全新大V DD-i虎鯨上市，限時(shí)權(quán)益價(jià)12.59萬元起

03-10

點(diǎn)擊查看更多 +

全站最新

蘋果Apple One高級(jí)訂閱海外升級(jí)，新增“邀請(qǐng)”與“美食”兩大特權(quán)

微信安卓8.0.57測(cè)試版來襲！主要優(yōu)化哪些已知問題？

小米人形機(jī)器人CyberOne量產(chǎn)計(jì)劃是謠言？官方這樣說

微信朋友圈大升級(jí)：5分鐘長(zhǎng)視頻隨心分享！

GDC2025：EA揭秘死亡空間與鋼鐵俠游戲紋理創(chuàng)新技術(shù)

企業(yè)應(yīng)對(duì)職場(chǎng)“內(nèi)卷”：強(qiáng)制下班，以人為本的新策略？

熱門內(nèi)容

本欄最新

企業(yè)應(yīng)對(duì)職場(chǎng)“內(nèi)卷”：強(qiáng)制下班，以人為本的新策略？

微信朋友圈大升級(jí)：5分鐘長(zhǎng)視頻直接發(fā)，還有哪些新功能你不可不知？

蘋果2025年將推史上最大軟件革新，統(tǒng)一界面風(fēng)格能否重振銷量？

吉利銀河翼真L380豪華MPV上市，29.99萬起售，配置豪華令人驚嘆！

吉利銀河翼真L380陸地空客MPV新上市，豪華配置引領(lǐng)MPV新風(fēng)尚！

iPhone 17系列真容初現(xiàn)：設(shè)計(jì)大改，eSIM或成新驚喜？

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

美團(tuán)DeepSeek R1模型INT8量化版發(fā)布，老顯卡也能暢享高效推理

美團(tuán)DeepSeek R1模型INT8量化版發(fā)布，老顯卡也能暢享高效推理