滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 數(shù)碼極客 > 正文內(nèi)容

安謀科技“周易”NPU新突破：DeepSeek-R1模型端側(cè)部署，速度飆升至40 tokens/s

時(shí)間：2025-02-14 13:05 來(lái)源：ITBEAR作者：顧雨柔

安謀科技近日宣布，其新一代“周易”NPU處理器已成功在端側(cè)部署并運(yùn)行DeepSeek-R1系列模型，不僅性能表現(xiàn)出色，而且成本效益顯著。

這款“周易”NPU專為AI大模型設(shè)計(jì)，架構(gòu)上進(jìn)行了深度優(yōu)化。據(jù)悉，其Beta測(cè)試版本已在2024年末向部分早期用戶開放，預(yù)計(jì)今年上半年將正式面世。

DeepSeek-R1系列中的1.5B和7B蒸餾版本推出后，“周易”NPU迅速在Emulation平臺(tái)上完成了部署與優(yōu)化，并在FPGA平臺(tái)上成功演示了端到端應(yīng)用。測(cè)試結(jié)果顯示，在標(biāo)準(zhǔn)測(cè)試環(huán)境下，“周易”NPU在首字計(jì)算階段的算力利用率超過(guò)40%，解碼階段的有效帶寬利用率更是高達(dá)80%以上。

該NPU的帶寬利用率展現(xiàn)出高線性特性，能夠靈活適應(yīng)從16GB/s到256GB/s的系統(tǒng)帶寬需求。在7B版本、上下文長(zhǎng)度為1024的場(chǎng)景下，“周易”NPU的最高處理速度可達(dá)每秒40 tokens，并支持動(dòng)態(tài)長(zhǎng)度的模型推理輸入。

安謀科技的軟件棧對(duì)大模型的支持和優(yōu)化也達(dá)到了成熟水平，通過(guò)動(dòng)態(tài)推理優(yōu)化和硬件算力潛力的挖掘，顯著提升了推理速度和吞吐量。目前，該軟件棧已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多種主流大模型，并提供了與Hugging Face模型庫(kù)的對(duì)接工具鏈，方便用戶直接部署主流模型。

在硬件層面，“周易”NPU采用先進(jìn)的7nm工藝制造，單Cluster算力最高可達(dá)80 TOPS，能夠輕松應(yīng)對(duì)超過(guò)16K上下文長(zhǎng)度的大模型部署需求。同時(shí)，其對(duì)外帶寬提升至256GB/s，有效解決了大模型計(jì)算的帶寬瓶頸問(wèn)題。

“周易”NPU還支持FP16數(shù)據(jù)精度計(jì)算，完整支持INT4軟硬量化加速，并具備多核算力擴(kuò)展能力，滿足端側(cè)模型的低首字延遲需求。它還擁有強(qiáng)大的多任務(wù)并行處理能力，通過(guò)細(xì)粒度的任務(wù)調(diào)度和優(yōu)先級(jí)資源分配，實(shí)現(xiàn)了多任務(wù)靈活切換，確保了傳統(tǒng)語(yǔ)音、視覺業(yè)務(wù)與大模型應(yīng)用的高效協(xié)同。

更多>同類內(nèi)容

蔡崇信：開源大模型引領(lǐng)AI未來(lái)，閉源開發(fā)價(jià)值幾何？

02-14

中國(guó)科技崛起！華為DeepSeek等企業(yè)領(lǐng)跑，美國(guó)科技霸主地位動(dòng)搖？

02-14

《合金裝備Δ：蛇食者》Xbox版將推新聯(lián)動(dòng)模式，竟是《炸彈人》？

02-14

小米米家智能晾衣機(jī)Pro預(yù)售特惠，到手僅需664.3元，智能生活從此開始！

02-14

微軟Xbox掌機(jī)或?qū)⒋钶d高通驍龍，硬件迭代大幕正式拉開？

02-14

美團(tuán)“超時(shí)免罰”新策：積分制助力騎手，配送體驗(yàn)?zāi)芊翊笊?jí)？

02-14

藍(lán)寶石RX 7650 GRE顯卡實(shí)測(cè)：性能如何？能否超越RTX 4060？

02-14

《如龍8外傳》試玩版上線，但存檔不能繼承至正式版

02-14

育碧成本削減成效顯著，提前超額完成2億歐元目標(biāo)

02-14

英偉達(dá)2027年AI業(yè)務(wù)收入或達(dá)2590億美元，但Blackwell顯卡交付成挑戰(zhàn)

02-14

張?zhí)m團(tuán)隊(duì)浴火重生直播、雷軍開車直播遭禁，直播帶貨圈大事不斷！

02-14

華住集團(tuán)金輝榮膺年度人物，透視華住二十年卓越之旅

02-14

《雙人成行》制作人反駁EA：Hazelight永不涉足實(shí)時(shí)服務(wù)型游戲

02-14

藍(lán)寶石NiTRO+ B850M WIFI主板評(píng)測(cè)：3A平臺(tái)性能新標(biāo)桿

02-14

奇瑞尹同躍：2025年首要目標(biāo)鎖定企業(yè)上市，開啟全新征程

02-14

點(diǎn)擊查看更多 +

全站最新

安謀科技“周易”NPU新突破：DeepSeek-R1模型端側(cè)部署，速度飆升至40 tokens/s

2025國(guó)補(bǔ)來(lái)襲！蘋果華為大降價(jià)，你的新機(jī)在列嗎？

OPPO Find N5折疊屏新機(jī)：8.93mm厚度刷新紀(jì)錄，沉浸式大屏體驗(yàn)來(lái)襲！

京東外賣入局，能否攪動(dòng)即時(shí)零售市場(chǎng)風(fēng)云？

警惕！陌生人推銷“跑字機(jī)”，背后或有欺詐陷阱

京東外賣入局，能否打破美團(tuán)霸主地位引發(fā)即時(shí)零售新變局？

熱門內(nèi)容

本欄最新

安謀科技“周易”NPU新突破：DeepSeek-R1模型端側(cè)部署，速度飆升至40 tokens/s

蔡崇信：開源大模型引領(lǐng)AI未來(lái)，閉源開發(fā)價(jià)值幾何？

中國(guó)科技崛起！華為DeepSeek等企業(yè)領(lǐng)跑，美國(guó)科技霸主地位動(dòng)搖？

《合金裝備Δ：蛇食者》Xbox版將推新聯(lián)動(dòng)模式，竟是《炸彈人》？

美團(tuán)“超時(shí)免罰”新策：積分制助力騎手，配送體驗(yàn)?zāi)芊翊笊?jí)？

藍(lán)寶石RX 7650 GRE顯卡實(shí)測(cè)：性能如何？能否超越RTX 4060？

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

安謀科技“周易”NPU新突破：DeepSeek-R1模型端側(cè)部署，速度飆升至40 tokens/s

安謀科技“周易”NPU新突破：DeepSeek-R1模型端側(cè)部署，速度飆升至40 tokens/s