滾動資訊

當(dāng)前位置：網(wǎng)界 > 產(chǎn)業(yè)經(jīng)濟(jì) > 正文內(nèi)容

阿里Qwen團(tuán)隊發(fā)布QwQ-32B：少量參數(shù)實現(xiàn)高性能，媲美DeepSeek R1

時間：2025-03-06 07:55 作者：沈如風(fēng)

阿里巴巴的Qwen團(tuán)隊近日震撼發(fā)布了其最新的科研成果——QwQ-32B大型語言模型，這一創(chuàng)新成果迅速引起了業(yè)界的廣泛關(guān)注。

QwQ-32B模型擁有驚人的320億參數(shù)，但其性能卻足以與擁有6710億參數(shù)（激活部分為370億）的DeepSeek-R1模型相媲美。這一成就的實現(xiàn)，得益于Qwen團(tuán)隊在強(qiáng)化學(xué)習(xí)領(lǐng)域的突破，使得QwQ-32B在參數(shù)數(shù)量僅為DeepSeek-R1約1/21的情況下，實現(xiàn)了性能的飛躍。

不僅如此，阿里巴巴還在QwQ-32B的推理模型中融入了與Agent相關(guān)的能力，這一創(chuàng)新使得該模型能夠在使用工具的同時，進(jìn)行批判性思考，并根據(jù)環(huán)境的反饋靈活調(diào)整其推理過程。這一特性無疑大大增強(qiáng)了模型的實用性和智能化水平。

為了全面評估QwQ-32B的性能，阿里巴巴團(tuán)隊在一系列基準(zhǔn)測試中對其進(jìn)行了嚴(yán)格的測試，包括數(shù)學(xué)推理、編程能力以及通用能力等多個方面。結(jié)果顯示，在數(shù)學(xué)能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，QwQ-32B的表現(xiàn)與DeepSeek-R1相當(dāng)，遠(yuǎn)遠(yuǎn)超過了o1-mini以及相同尺寸的R1蒸餾模型。

在由meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評測榜”LiveBench、谷歌提出的指令遵循能力IFeval評測集，以及加州大學(xué)伯克利分校等提出的評估準(zhǔn)確調(diào)用函數(shù)或工具的BFCL測試中，QwQ-32B均取得了超越DeepSeek-R1的優(yōu)異成績。這些測試結(jié)果無疑進(jìn)一步證明了QwQ-32B的強(qiáng)大性能和廣泛適用性。

QwQ-32B模型已經(jīng)在Hugging Face和ModelScope平臺上開源，廣大開發(fā)者可以通過這些平臺直接獲取并使用該模型。同時，用戶還可以通過Qwen Chat直接體驗QwQ-32B的強(qiáng)大功能，感受其帶來的智能化變革。

更多>同類內(nèi)容

微信朋友圈大升級：5分鐘長視頻隨心分享！

03-11

億航智能EH216-S無人機(jī)墨西哥首飛成功，全球版圖增至19國

03-11

蘋果新款M4芯片MacBook Air與Mac Studio首日即享軟件升級

03-11

三星Galaxy Ring智能戒指專利曝光：指紋+手勢，解鎖新交互方式？

03-11

三星“Display Assistant Beta”低調(diào)上線，能否成為屏幕管理新利器？

03-11

Apple TV應(yīng)用在iOS 18.4測試版中迎來重大升級，體驗更流暢！

03-11

巴西蘋果用戶將迎來《堡壘之夜》回歸，蘋果側(cè)載禁令引爭議

03-11

小米SU7 Ultra高價入市反獲熱捧，Canalys贊其顛覆性能車市場

03-11

海爾回應(yīng)網(wǎng)友需求，連夜開發(fā)“全能懶人洗衣機(jī)”？

03-10

PS5 Slim 光驅(qū)版攜手《宇宙機(jī)器人》同捆上市，價格成懸念！

03-10

零跑B系列月銷目標(biāo)4萬輛，被稱“半價理想”引熱議：真有那么強(qiáng)？

03-10

本田中國燃油車發(fā)動機(jī)產(chǎn)能大減，電動化轉(zhuǎn)型加速能否破局？

03-10

樂鑫科技ESP32芯片“后門”風(fēng)波：實為調(diào)試命令，公司已澄清

03-10

輕乳茶賽道激戰(zhàn)正酣，茶顏悅色、霸王茶姬等品牌如何突圍？

03-10

華為MatePad系列平板正式招募鴻蒙HarmonyOS NEXT Beta版升級用戶

03-10

點(diǎn)擊查看更多 +

全站最新

蘋果Apple One高級訂閱海外升級，新增“邀請”與“美食”兩大特權(quán)

微信安卓8.0.57測試版來襲！主要優(yōu)化哪些已知問題？

小米人形機(jī)器人CyberOne量產(chǎn)計劃是謠言？官方這樣說

微信朋友圈大升級：5分鐘長視頻隨心分享！

GDC2025：EA揭秘死亡空間與鋼鐵俠游戲紋理創(chuàng)新技術(shù)

企業(yè)應(yīng)對職場“內(nèi)卷”：強(qiáng)制下班，以人為本的新策略？

熱門內(nèi)容

本欄最新

微信朋友圈大升級：5分鐘長視頻隨心分享！

億航智能EH216-S無人機(jī)墨西哥首飛成功，全球版圖增至19國

蘋果新款M4芯片MacBook Air與Mac Studio首日即享軟件升級

三星Galaxy Ring智能戒指專利曝光：指紋+手勢，解鎖新交互方式？

三星“Display Assistant Beta”低調(diào)上線，能否成為屏幕管理新利器？

Apple TV應(yīng)用在iOS 18.4測試版中迎來重大升級，體驗更流暢！

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

阿里Qwen團(tuán)隊發(fā)布QwQ-32B：少量參數(shù)實現(xiàn)高性能，媲美DeepSeek R1

阿里Qwen團(tuán)隊發(fā)布QwQ-32B：少量參數(shù)實現(xiàn)高性能，媲美DeepSeek R1