滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 智能出行 > 正文內(nèi)容

阿里云Qwen2.5-Omni多模態(tài)模型發(fā)布，全方位感知能力再升級(jí)！

時(shí)間：2025-03-27 07:07 作者：任飛揚(yáng)

阿里云在最新一輪的技術(shù)創(chuàng)新中，推出了通義千問(wèn)Qwen模型家族的新成員——Qwen2.5-Omni。這款旗艦級(jí)端到端多模態(tài)模型不僅向公眾展示了其強(qiáng)大的技術(shù)實(shí)力，還通過(guò)開(kāi)源的方式，在Hugging Face、ModelScope、DashScope和GitHub等平臺(tái)上供開(kāi)發(fā)者使用。

Qwen2.5-Omni專為全面的多模態(tài)感知設(shè)計(jì)，能夠無(wú)縫處理包括文本、圖像、音頻和視頻在內(nèi)的多種輸入形式。其獨(dú)特之處在于，能夠?qū)崟r(shí)以流式方式響應(yīng)，并同時(shí)生成文本和自然語(yǔ)音合成的輸出。這一特性使得Qwen2.5-Omni在交互體驗(yàn)上達(dá)到了新的高度。

Qwen團(tuán)隊(duì)此次引入了全新的Thinker-Talker架構(gòu)，這一架構(gòu)是Qwen2.5-Omni的核心創(chuàng)新之一。Thinker模塊如同大腦，負(fù)責(zé)處理多模態(tài)輸入，生成高層語(yǔ)義表征和對(duì)應(yīng)文本內(nèi)容；而Talker模塊則像發(fā)聲器官，接收Thinker實(shí)時(shí)輸出的語(yǔ)義表征和文本，以流式方式流暢合成離散語(yǔ)音單元。這種架構(gòu)不僅提高了模型的處理效率，還保證了輸出的自然性和穩(wěn)定性。

在實(shí)時(shí)音視頻交互方面，Qwen2.5-Omni同樣表現(xiàn)出色。其架構(gòu)支持完全實(shí)時(shí)交互，能夠分塊輸入并即時(shí)輸出，為用戶提供了流暢無(wú)阻的交互體驗(yàn)。Qwen2.5-Omni在語(yǔ)音生成的自然性和穩(wěn)定性方面也超越了現(xiàn)有的許多流式和非流式替代方案。

在性能表現(xiàn)上，Qwen2.5-Omni同樣不容小覷。與同等規(guī)模的單模態(tài)模型相比，Qwen2.5-Omni在多模態(tài)任務(wù)中展現(xiàn)出了卓越的性能。在音頻能力上，它優(yōu)于類似大小的Qwen2-Audio，并與Qwen2.5-VL-7B保持同等水平。同時(shí)，Qwen2.5-Omni在端到端語(yǔ)音指令跟隨方面也表現(xiàn)出色，與文本輸入處理的效果相媲美。

模型架構(gòu)圖

為了更直觀地展示Qwen2.5-Omni的性能優(yōu)勢(shì)，阿里云還提供了多個(gè)基準(zhǔn)測(cè)試的結(jié)果。在多模態(tài)任務(wù)OmniBench中，Qwen2.5-Omni達(dá)到了SOTA（State-of-the-Art）的表現(xiàn)。在單模態(tài)任務(wù)中，Qwen2.5-Omni也在多個(gè)領(lǐng)域中表現(xiàn)優(yōu)異，包括語(yǔ)音識(shí)別、翻譯、音頻理解、圖像推理、視頻理解以及語(yǔ)音生成等。

模型性能圖

對(duì)于開(kāi)發(fā)者而言，Qwen2.5-Omni的開(kāi)源無(wú)疑是一個(gè)巨大的福音。他們可以通過(guò)訪問(wèn)Hugging Face、ModelScope、DashScope和GitHub等平臺(tái)，輕松獲取模型并進(jìn)行二次開(kāi)發(fā)。這不僅有助于推動(dòng)人工智能技術(shù)的進(jìn)一步發(fā)展，還為開(kāi)發(fā)者提供了更多的創(chuàng)新機(jī)會(huì)。

如果你對(duì)Qwen2.5-Omni感興趣，不妨親自體驗(yàn)一下。你可以通過(guò)訪問(wèn)ModelScope平臺(tái)上的Qwen2.5-Omni Demo頁(yè)面，感受這款旗艦級(jí)多模態(tài)模型的強(qiáng)大魅力。

更多>同類內(nèi)容

ChatGPT圖像生成太火爆，免費(fèi)版上線時(shí)間推遲引熱議

03-27

索尼“小身材大作為”，新品發(fā)布會(huì)將揭曉Venice擴(kuò)展系統(tǒng)Mini？

03-26

小米SU7汽車VRU保護(hù)領(lǐng)先，C-NCAP測(cè)試成績(jī)卓越展現(xiàn)安全實(shí)力

03-26

神牛AD21/32/33系列電動(dòng)柔光片上市，一鍵調(diào)控售價(jià)2680元起

03-26

OpenAI或建數(shù)據(jù)中心，欲躋身全球最大存儲(chǔ)客戶行列？

03-26

實(shí)控人“畫(huà)餅”帶飛股價(jià)遭反噬，ST花王澄清后閃崩引關(guān)注

03-26

AR眼鏡未來(lái)展望：雷鳥(niǎo)創(chuàng)新CEO預(yù)言，終局七八家勝出，市場(chǎng)規(guī)模超手機(jī)

03-26

諾獎(jiǎng)得主彭羅斯：AI無(wú)真正意識(shí)，不應(yīng)等同人類智能

03-26

iPhone 17 Air機(jī)模曝光：厚度僅5.5mm，比Pro薄一半？

03-26

星閃技術(shù)引領(lǐng)，8K鼠標(biāo)如何重塑我們的游戲與辦公體驗(yàn)？

03-26

奇瑞iCAR新車型2025年Q4量產(chǎn)，攜手禾賽激光雷達(dá)升級(jí)智駕體驗(yàn)

03-26

鴻蒙5商用引應(yīng)用適配熱潮，生態(tài)體驗(yàn)迭代升級(jí)中

03-26

臺(tái)鈴V6扁線輪轂電機(jī)：新能源汽車技術(shù)跨界，電動(dòng)兩輪車?yán)m(xù)航大增？

03-26

日產(chǎn)Leaf純電跨界SUV亮相，續(xù)航力近600公里引期待

03-26

寶駿“享境”旗艦轎車4月7日預(yù)售，智駕3.0+智能座艙引領(lǐng)新潮流

03-26

點(diǎn)擊查看更多 +

全站最新

微信鴻蒙版1.0.5.32邀測(cè)升級(jí)，新功能體驗(yàn)等你來(lái)嘗鮮！

《復(fù)仇者聯(lián)盟5》演員陣容曝光，小羅伯特·唐尼將演反派“毀滅日”？

大馬力汽車上路該限嗎？韓路：關(guān)鍵在人不在車

廣汽集團(tuán)否認(rèn)收購(gòu)恒大汽車南沙工廠，恒大汽車“白衣騎士”何在？

OPPO Find X8s系列首發(fā)！聯(lián)發(fā)科天璣9400+多核跑分破8500，性能再升級(jí)

樂(lè)魔二代DigitalLIZA膠片掃描匣上市，家中輕松掃膠片，528元起售

熱門(mén)內(nèi)容

本欄最新

ChatGPT圖像生成太火爆，免費(fèi)版上線時(shí)間推遲引熱議

神牛AD21/32/33系列電動(dòng)柔光片上市，一鍵調(diào)控售價(jià)2680元起

實(shí)控人“畫(huà)餅”帶飛股價(jià)遭反噬，ST花王澄清后閃崩引關(guān)注

AR眼鏡未來(lái)展望：雷鳥(niǎo)創(chuàng)新CEO預(yù)言，終局七八家勝出，市場(chǎng)規(guī)模超手機(jī)

iPhone 17 Air機(jī)模曝光：厚度僅5.5mm，比Pro薄一半？

星閃技術(shù)引領(lǐng)，8K鼠標(biāo)如何重塑我們的游戲與辦公體驗(yàn)？

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

阿里云Qwen2.5-Omni多模態(tài)模型發(fā)布，全方位感知能力再升級(jí)！

阿里云Qwen2.5-Omni多模態(tài)模型發(fā)布，全方位感知能力再升級(jí)！