滾動資訊

當(dāng)前位置：網(wǎng)界 > 產(chǎn)業(yè)經(jīng)濟 > 正文內(nèi)容

清華團隊重大突破！RTX4090單卡即可滿血運行DeepSeek-R1大模型

時間：2025-02-15 19:10 來源：ITBEAR作者：鐘景軒

近日，AI大模型DeepSeek-R1的使用難題成為了用戶們關(guān)注的焦點。此前，用戶主要通過云服務(wù)或本地部署來使用這款模型，但云服務(wù)頻繁宕機，而本地部署的版本多為參數(shù)量大幅縮水的蒸餾版。對于一般用戶而言，在普通硬件上運行DeepSeek-R1的滿血版幾乎是不可能的任務(wù)，即便是開發(fā)者，租賃服務(wù)器的成本也令人望而卻步。

然而，這一局面即將迎來重大改變。清華大學(xué)KVCache.AI團隊與趨境科技攜手發(fā)布的KTransformers開源項目，近日宣布取得了突破性進展，成功破解了千億級大模型本地部署的難題。這一突破標(biāo)志著大模型推理將擺脫“云端壟斷”，走向更加普惠化的道路。

據(jù)KTransformers團隊介紹，他們已在配備24GB顯存和382GB內(nèi)存的PC上成功實現(xiàn)了DeepSeek-R1、V3的671B滿血版的本地運行，速度提高了3至28倍。不僅如此，他們還宣布支持更長的上下文（24GB單卡支持4~8K），并實現(xiàn)了15%的加速，每秒最多可處理16個Tokens。

KTransformers作為一個以Python為中心的靈活框架，其核心設(shè)計注重可擴展性。用戶只需通過一行代碼即可實現(xiàn)和注入優(yōu)化模塊，從而訪問兼容Transformers的界面、符合OpenAI和Ollama標(biāo)準(zhǔn)的RESTful API，甚至是類似ChatGPT的簡化網(wǎng)頁用戶界面。這一技術(shù)的推出，徹底改寫了AI大模型依賴昂貴云服務(wù)器的歷史格局。

DeepSeek-R1基于混合專家（MoE）架構(gòu)，通過將任務(wù)分配給不同專家模塊，并在每次推理時僅激活部分參數(shù)來提高效率。KTransformers團隊創(chuàng)新性地將非共享稀疏矩陣卸載至CPU內(nèi)存處理，并結(jié)合高速算子優(yōu)化，成功將顯存需求從傳統(tǒng)8卡A100的320GB壓縮至單卡24GB。這一創(chuàng)新使得普通用戶只需24G顯存即可在本地運行DeepSeek-R1、V3的671B滿血版，預(yù)處理速度最高可達286 tokens/s，推理生成速度最高能達到14 tokens/s。

KTransformers團隊還通過減少CPU/GPU通信斷點，實現(xiàn)單次解碼僅需一次完整的CUDA Graph調(diào)用，生成速度優(yōu)化至14 tokens/s，功耗僅為80W，整機成本約2萬元，僅為傳統(tǒng)8卡A100方案的2%。經(jīng)過開發(fā)者實測，使用RTX 3090顯卡和200GB內(nèi)存配置，結(jié)合Unsloth優(yōu)化，Q2_K_XL模型推理速度可達9.1 tokens/s，實現(xiàn)了千億級模型的“家庭化”運行。

值得注意的是，KTransformers并非一個單純的推理框架，也不限于DeepSeek模型。它可以兼容各式各樣的MoE模型和算子，能夠集成各種算子并進行各種組合的測試。同時，KTransformers還提供了Windows、Linux平臺的支持，感興趣的用戶可自行嘗試。但要想使用KTransformers，也需要滿足一定的硬件條件，包括英特爾至強Gold 6454S 1T DRAM CPU、RTX 4090D（24G VRAM）GPU、標(biāo)準(zhǔn)DDR5-4800服務(wù)器DRAM（1TB）內(nèi)存以及CUDA 12.1或更高版本。

更多>同類內(nèi)容

比亞迪全球銷量躍升，中國汽車品牌國際化步伐加速！

02-15

雷軍發(fā)言：小米15周年再出發(fā)，今年增速預(yù)計超30%

02-15

Spotify將推Music Pro訂閱，音質(zhì)升級享演唱會門票特權(quán)？

02-15

小米SU7 Ultra上賽奪冠幕后：挑戰(zhàn)、征服與中國的汽車夢

02-15

2027年全球電力需求年增4%：誰將領(lǐng)跑這場“電力競賽”？

02-15

小米SU7開門紅！首月銷量奪冠，新勢力車型中獨樹一幟

02-15

AMD Radeon RX 9070 XT顯卡現(xiàn)身，搭載64個RDNA 4計算單元功耗飆升至900W

02-15

松山湖材料實驗室重磅推出：MatChat AI，材料科學(xué)智能問答新紀(jì)元

02-15

海淀打造投資熱土，系列惠企新政助力企業(yè)創(chuàng)新發(fā)展

02-15

馬斯克974億美金收購OpenAI遭拒，收購戰(zhàn)上演“口水仗”

02-15

起亞Seltos換代車型路測曝光，方正硬朗設(shè)計，混動版即將來襲

02-15

阿斯頓·馬丁新帥豪言：18個月能否讓老牌豪車重?zé)ㄐ律?/a>

02-15

馬斯克迎來第13個孩子，生母為美作家Ashley St. Clair

02-15

黃金原油周線各異，下周走勢生死線何在？

02-15

宇宙演化之謎：十億年探索之旅能否揭開真相？

02-15

點擊查看更多 +

全站最新

清華團隊重大突破！RTX4090單卡即可滿血運行DeepSeek-R1大模型

廣汽集團12億打造數(shù)字化新工廠，2026年投產(chǎn)一體式壓鑄技術(shù)

比亞迪全球銷量躍升，中國汽車品牌出海勢頭強勁！

外資巨頭貝萊德斷貸棄樓，上海北岸長風(fēng)辦公樓成燙手山芋？

比亞迪全球銷量躍升，中國汽車品牌國際化步伐加速！

2025南京大健康展，華墾乳業(yè)攜特色駝乳，共探健康產(chǎn)業(yè)新機遇！

熱門內(nèi)容

本欄最新

清華團隊重大突破！RTX4090單卡即可滿血運行DeepSeek-R1大模型

比亞迪全球銷量躍升，中國汽車品牌國際化步伐加速！

雷軍發(fā)言：小米15周年再出發(fā)，今年增速預(yù)計超30%

小米SU7 Ultra上賽奪冠幕后：挑戰(zhàn)、征服與中國的汽車夢

小米SU7開門紅！首月銷量奪冠，新勢力車型中獨樹一幟

AMD Radeon RX 9070 XT顯卡現(xiàn)身，搭載64個RDNA 4計算單元功耗飆升至900W

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

清華團隊重大突破！RTX4090單卡即可滿血運行DeepSeek-R1大模型

清華團隊重大突破！RTX4090單卡即可滿血運行DeepSeek-R1大模型