昆侖萬維在近期的一周內(nèi),以驚人的速度發(fā)布了六款A(yù)I大模型,這一連串的動作在科技界掀起了軒然大波。從8月11日至15日,這家公司幾乎每天都能在科技頭條上占據(jù)一席之地,全面展示了其在多模態(tài)AI領(lǐng)域的突破性進展。
這一系列發(fā)布涵蓋了視頻生成、世界模型、統(tǒng)一多模態(tài)模型、智能體以及音樂創(chuàng)作等多個方向。昆侖萬維通過Skywork平臺,向外界展示了其技術(shù)的深度和廣度。這種高頻且密集的產(chǎn)品發(fā)布策略,在國內(nèi)廠商中實屬罕見,也讓人不禁好奇,昆侖萬維究竟在下一盤怎樣的棋?
8月11日,昆侖萬維首先推出了SkyReels-A3,這是一款基于音頻驅(qū)動的人像視頻生成模型。它利用先進的DiT(Diffusion Transformer)視頻擴散模型技術(shù),能夠?qū)崿F(xiàn)任意時長的全模態(tài)音頻驅(qū)動數(shù)字人創(chuàng)作。用戶只需上傳一張照片并配上語音,模型就能精準匹配口型、表情和動作,生成高質(zhì)量的視頻內(nèi)容。SkyReels-A3在唇形同步、面部穩(wěn)定性和動作自然度方面表現(xiàn)出色,并支持更豐富的鏡頭變化和長達60秒的視頻生成,為電影制作、虛擬直播、游戲開發(fā)等領(lǐng)域帶來了全新的可能性。
緊接著,昆侖萬維在第二天推出了Matrix系列世界模型的升級版本——Matrix-Game 2.0。這是一款交互式視頻生成模型,能夠在低延遲、高幀率的情況下生成連續(xù)的視頻內(nèi)容,且生成時長可擴展至分鐘級。Matrix-3D模型則用于3D世界的生成與探索,能夠生成支持360度自由環(huán)視的3D場景。這兩個模型打破了內(nèi)容生成與交互之間的壁壘,為游戲引擎、元宇宙等領(lǐng)域提供了強有力的技術(shù)支撐。
8月13日,昆侖萬維發(fā)布了Skywork UniPic 2.0,這是一款面向統(tǒng)一多模態(tài)建模的高效訓(xùn)練與推理框架。它通過輕量化優(yōu)化和多模態(tài)聯(lián)合訓(xùn)練,構(gòu)建了理解、生圖、編輯一體化的核心能力。目前,Skywork UniPic 2.0及其系列模型已全面開源,為開發(fā)者提供了極大的便利。
在8月14日,昆侖萬維正式推出了Skywork Deep Research Agent v2,這是天工超級智能體的核心引擎。自上線以來,該模型已經(jīng)在AI Office領(lǐng)域發(fā)揮了巨大作用,為用戶產(chǎn)出了大量高質(zhì)量的文檔、PPT等交付物。新版本的推出將進一步提升用戶體驗。
作為技術(shù)發(fā)布周的收官之作,昆侖萬維在8月15日正式推出了音樂模型Mureka V7.5。這款模型能夠AI生成音樂,不僅大幅節(jié)約了時間和成本,還在音樂性和文本控制準確性方面領(lǐng)先同類模型。Mureka自上線以來,已經(jīng)在海內(nèi)外獲得了廣泛好評,用戶數(shù)量持續(xù)增長。
昆侖萬維的這一系列動作并非突如其來,而是其長期投入AI領(lǐng)域的必然結(jié)果。作為一家從游戲起家的公司,昆侖萬維在轉(zhuǎn)型為平臺型互聯(lián)網(wǎng)企業(yè)后,又加速向AI企業(yè)轉(zhuǎn)型。自提出“All in AGI 與 AIGC”以來,公司持續(xù)投入大量資源開發(fā)各類AI應(yīng)用,并前瞻性地完成了“算力基礎(chǔ)設(shè)施—大模型算法—AI應(yīng)用”全產(chǎn)業(yè)鏈布局。
此次技術(shù)發(fā)布周不僅展示了昆侖萬維在AI領(lǐng)域的強大實力,也標志著其從“技術(shù)探索期”邁入“商業(yè)收獲期”。SkyReels、Mureka等產(chǎn)品矩陣已在終端市場獲得積極反饋,海外業(yè)務(wù)增速迅猛。同時,昆侖萬維還入選了Hugging Face發(fā)布的“中國AI開源16強”,進一步證明了其在開源社區(qū)的貢獻和影響力。
隨著AI技術(shù)的不斷發(fā)展,昆侖萬維將繼續(xù)全心投入技術(shù)創(chuàng)新,保持競爭優(yōu)勢,加速AI應(yīng)用落地和商業(yè)化變現(xiàn)。可以預(yù)見的是,這家公司在AI領(lǐng)域的探索之路還遠未結(jié)束。