近日,阿里云宣布了一項重大開源舉措,正式推出了Qwen3系列模型。這一系列模型相較于DeepSeek-R1,參數(shù)量大幅減少至三分之一,為用戶提供了更為經(jīng)濟高效的解決方案。
緊接著,國家級算力服務平臺超算互聯(lián)網(wǎng)迅速響應,全面上線了Qwen3系列的所有模型。此次上線的模型涵蓋了六個Dense版本,從Qwen3-32B到Qwen3-0.6B,參數(shù)規(guī)模各異,滿足了不同用戶的需求。同時,平臺還推出了兩款MoE模型,Qwen3-235B-A22B和Qwen3-30B-A3B,前者總參數(shù)超過2350億,激活參數(shù)達220多億,后者總參數(shù)為300億,激活參數(shù)為30億。
Qwen3系列模型基于Apache 2.0協(xié)議進行開源,這意味著開發(fā)者與企業(yè)用戶均可以通過超算互聯(lián)網(wǎng)平臺輕松下載模型文件,進行快速開發(fā)與部署。這一舉措極大地降低了技術(shù)門檻,促進了人工智能技術(shù)的普及與應用。
超算互聯(lián)網(wǎng)平臺還透露,正在積極籌備上線Qwen3系列的模型鏡像及應用體驗服務。屆時,用戶將無需繁瑣的環(huán)境配置,即可通過零代碼的方式體驗Qwen3的對話系統(tǒng),享受云端服務的便捷與高效。
在性能方面,Qwen3系列模型同樣表現(xiàn)出色。特別是Qwen3-235B-A22B,在編碼、數(shù)學及通用能力等基準測試中展現(xiàn)出了強勁的實力,與當前多款主流大模型相比毫不遜色。而小型MoE模型Qwen3-30B-A3B也憑借其顯著的激活參數(shù)優(yōu)勢,在性能上遠超QwQ-32B。即便是Qwen3系列中的輕量級模型Qwen3-4B,其性能也可與Qwen2.5-72B-Instruct相媲美,展現(xiàn)了Qwen3系列模型在性能優(yōu)化方面的卓越成就。