滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 產(chǎn)業(yè)經(jīng)濟(jì) > 正文內(nèi)容

阿里通義千問Qwen3發(fā)布：混合推理模型，靈活切換思考模式

時(shí)間：2025-04-29 08:17 作者：馮璃月

阿里巴巴在技術(shù)創(chuàng)新領(lǐng)域再次邁出重要一步，于近日凌晨正式發(fā)布了其最新一代的通義千問模型——Qwen3。這一發(fā)布不僅標(biāo)志著阿里巴巴在人工智能領(lǐng)域的深厚積累，更讓Qwen3一躍成為全球最頂尖的開源模型。

Qwen3系列模型涵蓋了多個(gè)版本，從Qwen3-0.6B到Qwen3-32B，以及更高級(jí)的MoE模型Qwen3-30B-A3B和Qwen3-235B-A22B，它們在層數(shù)、頭數(shù)、嵌入綁定、上下文長度等關(guān)鍵指標(biāo)上展現(xiàn)出不同的配置。其中，Qwen3-235B-A22B作為旗艦?zāi)Ｐ?，在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中，與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級(jí)模型相比，展現(xiàn)出了卓越的性能。

Qwen3是國內(nèi)首個(gè)“混合推理模型”，它將“快思考”與“慢思考”巧妙融合于一個(gè)模型中，實(shí)現(xiàn)了算力消耗的極大節(jié)省。這種設(shè)計(jì)使得Qwen3能夠在面對復(fù)雜問題時(shí)進(jìn)行深入推理，而在處理簡單問題時(shí)則能提供快速響應(yīng)。

阿里云不僅開源了Qwen3的MoE模型權(quán)重，包括Qwen3-235B-A22B和Qwen3-30B-A3B，還開源了六個(gè)Dense模型，這些模型均在Apache 2.0許可下開放給公眾使用。這一舉措無疑將極大地推動(dòng)人工智能技術(shù)的發(fā)展和應(yīng)用。

Qwen3模型支持多達(dá)119種語言和方言，這一廣泛的多語言能力為全球用戶提供了前所未有的便利。無論是簡體中文、繁體中文還是粵語，Qwen3都能輕松應(yīng)對，為國際應(yīng)用開辟了全新的可能性。

在預(yù)訓(xùn)練方面，Qwen3的數(shù)據(jù)集相比前代Qwen2.5有了顯著擴(kuò)展。Qwen3使用了約36萬億個(gè)token的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，涵蓋了119種語言和方言。這些數(shù)據(jù)不僅來自網(wǎng)絡(luò)，還包括從PDF文檔中提取的文本信息。為了增加數(shù)學(xué)和代碼數(shù)據(jù)的數(shù)量，阿里云還利用Qwen2.5-Math和Qwen2.5-Coder這兩個(gè)專家模型合成了大量數(shù)據(jù)。

Qwen3的預(yù)訓(xùn)練過程分為三個(gè)階段，每個(gè)階段都針對不同的目標(biāo)和數(shù)據(jù)集進(jìn)行優(yōu)化。在第一階段，模型在超過30萬億個(gè)token上進(jìn)行了基礎(chǔ)預(yù)訓(xùn)練；在第二階段，通過增加知識(shí)密集型數(shù)據(jù)的比例來改進(jìn)數(shù)據(jù)集，并在額外的5萬億個(gè)token上進(jìn)行了預(yù)訓(xùn)練；在第三階段，使用高質(zhì)量的長上下文數(shù)據(jù)將上下文長度擴(kuò)展到32K token，以確保模型能夠處理更長的輸入。

在后訓(xùn)練方面，阿里云實(shí)施了一個(gè)四階段的訓(xùn)練流程，旨在開發(fā)同時(shí)具備思考推理和快速響應(yīng)能力的混合模型。這一流程包括長思維鏈冷啟動(dòng)、長思維鏈強(qiáng)化學(xué)習(xí)、思維模式融合和通用強(qiáng)化學(xué)習(xí)四個(gè)階段。

阿里云還為部署用戶提供了一種軟切換機(jī)制，允許用戶在enable_thinking=True時(shí)動(dòng)態(tài)控制模型的行為。用戶可以通過添加/think和/no_think指令來逐輪切換模型的思考模式，這一功能在多輪對話中尤為實(shí)用。

目前，用戶可以在Qwen Chat網(wǎng)頁版（chat.qwen.ai）和通義App中試用Qwen3模型，體驗(yàn)其強(qiáng)大的功能和靈活的思考模式。這一創(chuàng)新不僅將推動(dòng)人工智能技術(shù)的進(jìn)一步發(fā)展，也將為全球用戶帶來更加便捷和智能的服務(wù)。

更多>同類內(nèi)容

《艾爾登法環(huán)：黑夜君臨》PC配置揭曉，5月30日全平臺(tái)上線

04-29

OpenAI ChatGPT Search新增網(wǎng)購，無廣告推薦更貼心！

04-29

亞馬遜“柯伊伯計(jì)劃”首批27顆互聯(lián)網(wǎng)衛(wèi)星成功升空！

04-29

華為Watch 5智能手表曝光：圓形表盤新設(shè)計(jì)，起售價(jià)440歐元

04-29

蘋果Vision Pro迎來visionOS 2.5 Beta 4更新，你收到了嗎？

04-29

從“火雞棚”到科技巨頭，Arm芯片出貨量突破2500億顆傳奇歷程

04-29

起亞K4掀背版亮相紐約車展：短小精悍，載貨能力大升級(jí)！

04-28

廣汽昊鉑“EARTH大地”概念車驚艷上海車展，續(xù)航破千年底預(yù)售

04-28

iQOO散熱背夾3 Neo上市：22W大功率急速降溫，僅需79元！

04-28

2024年印度開發(fā)者App Store創(chuàng)收53億，超94%無需付蘋果傭金？

04-28

努比亞Z70S Ultra攝影師版震撼登場：真全面屏+國產(chǎn)定制主攝，竟能外接鏡頭！

04-28

領(lǐng)克900震撼上市：國內(nèi)首款天地尾門+六座旋轉(zhuǎn)座椅，限時(shí)售價(jià)28.99萬起！

04-28

AI編程新風(fēng)尚：Vibe Coding讓“小白”開發(fā)者也能大展身手

04-28

三星Galaxy S25 Edge將采用二代大猩猩玻璃陶瓷？配置再升級(jí)！

04-28

華碩ROG夜神RTX 5080攜手《毀滅戰(zhàn)士》，打造聯(lián)名顯卡新紀(jì)元！

04-28

點(diǎn)擊查看更多 +

全站最新

OpenAI ChatGPT Search新增網(wǎng)購，無廣告推薦更貼心！

OPPO Find X8 Ultra迎來ColorOS新升級(jí)，原彩ProXDR實(shí)況功能首亮相！

華為Watch Fit 4及Pro版曝光：1.82英寸大屏，售價(jià)219至299歐元不等

亞馬遜“柯伊伯計(jì)劃”首批27顆互聯(lián)網(wǎng)衛(wèi)星成功升空！

我國充電站覆蓋廣泛！充電基礎(chǔ)設(shè)施量達(dá)1374.9萬臺(tái)，同比增長近五成

華為Watch 5智能手表曝光：圓形表盤新設(shè)計(jì)，起售價(jià)440歐元

熱門內(nèi)容

本欄最新

OpenAI ChatGPT Search新增網(wǎng)購，無廣告推薦更貼心！

亞馬遜“柯伊伯計(jì)劃”首批27顆互聯(lián)網(wǎng)衛(wèi)星成功升空！

華為Watch 5智能手表曝光：圓形表盤新設(shè)計(jì)，起售價(jià)440歐元

從“火雞棚”到科技巨頭，Arm芯片出貨量突破2500億顆傳奇歷程

起亞K4掀背版亮相紐約車展：短小精悍，載貨能力大升級(jí)！

廣汽昊鉑“EARTH大地”概念車驚艷上海車展，續(xù)航破千年底預(yù)售

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

阿里通義千問Qwen3發(fā)布：混合推理模型，靈活切換思考模式

阿里通義千問Qwen3發(fā)布：混合推理模型，靈活切換思考模式