在AI視頻領(lǐng)域的競(jìng)技場(chǎng)上,一場(chǎng)無聲的變革正在悄然上演。曾經(jīng),Sora作為該領(lǐng)域的佼佼者,被眾多玩家視為對(duì)標(biāo)的目標(biāo),其發(fā)布后的一年多時(shí)間里,一張流傳于社交媒體上的梗圖生動(dòng)描繪了Sora坐在王座上,周圍是眾多膜拜者的場(chǎng)景,其中包括Runway、Pika、PixVerse等十多個(gè)競(jìng)爭(zhēng)對(duì)手。
然而,時(shí)過境遷,隨著可靈、即夢(mèng)等中國(guó)玩家的崛起,Sora的光芒似乎已不再那么耀眼。一位AI視頻從業(yè)者透露,現(xiàn)在的關(guān)注點(diǎn)已不再是簡(jiǎn)單地對(duì)標(biāo)Sora,而是如何加快縮短AI視頻生產(chǎn)和消費(fèi)之間的鴻溝。在各大AI論壇的現(xiàn)場(chǎng),討論DeepSeek的聲音逐漸蓋過了Sora,這背后折射出業(yè)界對(duì)AI視頻加速商業(yè)化和普及的迫切期待。
進(jìn)入2025年,AI視頻領(lǐng)域的戰(zhàn)火愈燒愈烈。不到半年的時(shí)間里,眾多玩家紛紛發(fā)布最新的視頻生成模型和產(chǎn)品更新,競(jìng)爭(zhēng)態(tài)勢(shì)愈發(fā)激烈。從解決視頻生成的一致性和可控性,到降低產(chǎn)品門檻、增強(qiáng)可編輯能力,再到融入工作流,讓產(chǎn)品更加易用,行業(yè)玩家以一個(gè)月,甚至是半個(gè)月一次的迭代速度加速AI視頻的落地。然而,新的問題也隨之浮現(xiàn)。
多位中腰部AIGC創(chuàng)業(yè)者表達(dá)了他們的焦慮。從商用角度來看,當(dāng)前AI視頻落地仍存在諸多困難。商單報(bào)價(jià)持續(xù)走低,抽卡不穩(wěn)定,制作成本仍然偏高。就現(xiàn)有產(chǎn)品功能而言,多數(shù)AI視頻產(chǎn)品正趨于同質(zhì)化。除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等功能。隨著功能的豐富和選擇的增多,賽道玩家間在視頻生成的質(zhì)量、成本和交互形式等方面的競(jìng)爭(zhēng)也日益激烈。
在這樣的背景下,不提Sora的AI視頻玩家開始將競(jìng)爭(zhēng)焦點(diǎn)放在了三個(gè)維度上:卷一致性、卷可用性和卷可玩性。所謂“一致性”,指的是視頻生成過程中幀與幀之間的過渡性、動(dòng)作的連續(xù)性和場(chǎng)景的真實(shí)性。為了提升一致性,AI視頻玩家在輸入端加強(qiáng)了控制力,比如提升圖生視頻能力,增加首尾幀、筆刷工具和多圖參考等,讓用戶能夠自定義視頻的開頭和結(jié)尾,同時(shí)保證生成內(nèi)容中的一致性。多模態(tài)融合也是提升一致性的重要手段之一。
在卷“可用性”方面,AI視頻玩家致力于完善創(chuàng)作者工作流相關(guān)配套工具。AIGC從業(yè)者可可觀察到,創(chuàng)作者主要關(guān)注三個(gè)核心問題:動(dòng)態(tài)編輯能力、鏡頭運(yùn)動(dòng)能力和端到端能力。針對(duì)這些需求,AI視頻玩家紛紛推出了相應(yīng)的解決方案,比如可靈等玩家支持多模態(tài)編輯,給視頻替換、添加或刪減元素;即夢(mèng)的“故事創(chuàng)作”模式可批量生成分鏡;Runway也上線了視頻編輯器。
而在卷“可玩性”方面,通過創(chuàng)意特效和模版吸引用戶則是不少玩家引流的關(guān)鍵手段。Pika憑借Pikaffects、Pikadditions走紅互聯(lián)網(wǎng);PixVerse靠著毒液效果走紅;Vidu則承接了GPT-4吉卜力風(fēng)流量外溢。這些創(chuàng)意特效和模版不僅豐富了AI視頻產(chǎn)品的功能,也為用戶帶來了更多的樂趣和選擇。
然而,盡管AI視頻產(chǎn)品功能日益豐富,但創(chuàng)作者們卻感到越來越焦慮。隨著AI視頻玩家加速迭代模型和產(chǎn)品,制作成本居高不下,而客戶對(duì)AI視頻的降本需求卻在不斷增加。以可靈2.0為例,生成一條5秒鐘的視頻需要100靈感值,黃金會(huì)員月費(fèi)58元可獲得660靈感值,能抽卡6次,一次生成約為10元。如果對(duì)畫質(zhì)要求低,單個(gè)鏡頭(一般1-5s)需要抽卡5次左右,意味著生成一個(gè)鏡頭就需要50元。如果涉及更復(fù)雜的場(chǎng)景和效果抽卡次數(shù)可能高達(dá)數(shù)十次,單個(gè)鏡頭成本可高達(dá)數(shù)百元。因此,一個(gè)三分鐘的AI短片在不算人力成本的情況下保守估計(jì)就要數(shù)萬元,這對(duì)于許多創(chuàng)作者來說是不劃算的。
在商業(yè)化方面,AI視頻大模型的價(jià)格下降趨勢(shì)并不明顯。C端目前采取的階梯付費(fèi)訂閱模式國(guó)內(nèi)對(duì)比國(guó)外玩家價(jià)格優(yōu)勢(shì)明顯,但在最先進(jìn)模型上頭部廠商的定價(jià)并未松動(dòng)。而在B端API上國(guó)內(nèi)廠商的價(jià)格優(yōu)勢(shì)則明顯高于國(guó)外廠商。一位行業(yè)人士預(yù)測(cè)短期內(nèi)視頻大模型的定價(jià)不會(huì)出現(xiàn)激烈的變化。一方面從現(xiàn)有產(chǎn)品層看盡管開源視頻生成模型中不乏如阿里通義萬相Wan2.1等玩家但取得身位領(lǐng)先的依舊是閉源大模型;另一方面降價(jià)本質(zhì)上也是一種定價(jià)營(yíng)銷策略目的是讓更多人將AI視頻用起來但前提是產(chǎn)品形態(tài)和交互已經(jīng)ready而現(xiàn)階段各大廠商還在探索產(chǎn)品形態(tài)不斷完善AI視頻生產(chǎn)環(huán)節(jié)。
盡管AI視頻領(lǐng)域的競(jìng)爭(zhēng)日益激烈但初創(chuàng)公司仍需保證自己在牌桌上。牌桌上的分化已經(jīng)開始顯現(xiàn)。一類大廠和初創(chuàng)企業(yè)選擇的是“模型+產(chǎn)品”兩步走這之中又可以分為“AGI派”和“平臺(tái)派”。海外如谷歌DeepMind和OpenAI是典型的“AGI派”他們的方向更偏向于構(gòu)建通往AGI的世界模型;而“平臺(tái)派”則是從一家AI視頻企業(yè)轉(zhuǎn)型為集合內(nèi)容和生產(chǎn)消費(fèi)為一體的平臺(tái)型公司。另一類則偏向于產(chǎn)品驅(qū)動(dòng)快速迭代比如聚焦在AI特效爆款迭代的Pika以視頻編輯生產(chǎn)力出圈的OpusClip和Capsule等。