在AI文生視頻領(lǐng)域,一場(chǎng)激烈的競(jìng)爭(zhēng)正在國(guó)內(nèi)上演,主角是字節(jié)跳動(dòng)旗下的即夢(mèng)AI與快手的可靈AI。然而,大洋彼岸的谷歌I/O 2025大會(huì)卻悄然為這場(chǎng)競(jìng)賽帶來(lái)了全新的視角和啟示。
當(dāng)前,國(guó)內(nèi)的AI文生視頻市場(chǎng)形成了雙雄對(duì)峙的格局。即夢(mèng)AI,在字節(jié)跳動(dòng)高達(dá)120億美元的AI投資戰(zhàn)略中占據(jù)核心位置,用戶(hù)數(shù)量實(shí)現(xiàn)了快速增長(zhǎng)。而可靈AI,自商業(yè)化以來(lái),憑借出色的性能評(píng)測(cè)表現(xiàn),累計(jì)營(yíng)業(yè)收入已超過(guò)1億元,成為快手2024年度財(cái)報(bào)中的亮點(diǎn)。
盡管即夢(mèng)AI和可靈AI在國(guó)內(nèi)市場(chǎng)各展所長(zhǎng),但谷歌I/O 2025大會(huì)上發(fā)布的Veo 3.0和Flow AI電影制作工具,不僅展示了技術(shù)上的突破,更提出了一種全新的生態(tài)化商業(yè)思路。這揭示了一個(gè)關(guān)鍵問(wèn)題:?jiǎn)渭兊募夹g(shù)競(jìng)爭(zhēng)或許已難以持續(xù)。
谷歌的新思維在于,真正的競(jìng)爭(zhēng)力不在于單個(gè)技術(shù)的領(lǐng)先,而在于構(gòu)建一個(gè)完整的AI驅(qū)動(dòng)生態(tài)系統(tǒng)。當(dāng)國(guó)內(nèi)的兩家平臺(tái)還在比拼性能指標(biāo)時(shí),谷歌已經(jīng)開(kāi)始思考如何將AI文生視頻能力融入用戶(hù)的整個(gè)工作流程中。
Veo 3.0首次實(shí)現(xiàn)了原生音頻生成,這一突破體現(xiàn)了谷歌在多模態(tài)融合方面的深刻理解。更重要的是,Veo 3.0并非作為一個(gè)獨(dú)立產(chǎn)品推出,而是深度整合到了Flow AI電影制作工具中。Flow匯集了Veo、Imagen和Gemini三大模型,讓用戶(hù)能夠無(wú)縫創(chuàng)建電影片段、場(chǎng)景和故事。
谷歌的商業(yè)化思路展現(xiàn)了三個(gè)關(guān)鍵特點(diǎn):首先,將基礎(chǔ)模型能力進(jìn)行生態(tài)化釋放,通過(guò)Veo 3.0的原生音頻生成,用戶(hù)能夠同時(shí)生成視聽(tīng)內(nèi)容,創(chuàng)作效率大幅提升。其次,圍繞訂閱體系對(duì)AI產(chǎn)品重新定價(jià),谷歌AI Ultra的高價(jià)格反映了整個(gè)AI生態(tài)系統(tǒng)的價(jià)值,將AI工具從效率提升工具升級(jí)為專(zhuān)業(yè)創(chuàng)作者的核心生產(chǎn)力平臺(tái)。最后,通過(guò)深度整合多個(gè)基礎(chǔ)大模型并嵌入各個(gè)常規(guī)產(chǎn)品,谷歌構(gòu)建了難以被單點(diǎn)突破的技術(shù)壁壘。
面對(duì)谷歌展現(xiàn)出的技術(shù)能力與生態(tài)化思維,即夢(mèng)AI和可靈AI都站在了戰(zhàn)略轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn)上。兩家平臺(tái)雖然在技術(shù)能力上各有優(yōu)勢(shì),但在生態(tài)化布局和商業(yè)模式創(chuàng)新方面仍有待提升。
一方面,兩家平臺(tái)需要加強(qiáng)對(duì)多模態(tài)能力的整合。即夢(mèng)AI以電影級(jí)畫(huà)質(zhì)和2K分辨率輸出著稱(chēng),而可靈AI引入了多模態(tài)視覺(jué)語(yǔ)言(MVL)概念。然而,與谷歌將三大模型深度融合的做法相比,兩家平臺(tái)的整合程度仍有提升空間。即夢(mèng)AI需要在多個(gè)專(zhuān)業(yè)文生視頻模型之間建立更緊密的協(xié)同關(guān)系,而可靈AI則應(yīng)該考慮將視頻生成能力與圖像生成能力進(jìn)行更深層次的融合。
另一方面,兩家平臺(tái)都需要構(gòu)建面向個(gè)人用戶(hù)的系統(tǒng)性訂閱產(chǎn)品。谷歌AI Ultra的定價(jià)策略提供了重要參考,AI工具的價(jià)值應(yīng)該基于其為用戶(hù)創(chuàng)造的完整價(jià)值鏈。即夢(mèng)AI可以利用其全球發(fā)布策略開(kāi)發(fā)差異化的訂閱產(chǎn)品,而可靈AI則可以考慮推出包含創(chuàng)作工具、素材庫(kù)、分發(fā)渠道和變現(xiàn)支持的一體化訂閱服務(wù)。
兩家平臺(tái)還需要完善創(chuàng)作生態(tài)的構(gòu)建。即夢(mèng)AI可以依靠TikTok的全球創(chuàng)作生態(tài),構(gòu)建一個(gè)面向國(guó)際創(chuàng)意社區(qū)的完整創(chuàng)作鏈條。而可靈AI則可以學(xué)習(xí)谷歌Flow的設(shè)計(jì)思路,開(kāi)發(fā)一個(gè)深度整合快手生態(tài)的創(chuàng)作工具,讓用戶(hù)從創(chuàng)意構(gòu)思到發(fā)布推廣、商業(yè)變現(xiàn)形成完整閉環(huán)。
最后,兩家平臺(tái)都需要考慮AI Agent的發(fā)展路徑。谷歌Agent Mode的推出預(yù)示著AI工具正在從被動(dòng)的內(nèi)容生成器向主動(dòng)的工作流助手轉(zhuǎn)變。對(duì)于即夢(mèng)AI和可靈AI而言,這意味著需要將文生視頻生成能力與更廣泛的創(chuàng)作和商業(yè)流程進(jìn)行整合。