字節(jié)跳動(dòng)旗下的火山引擎平臺(tái)近日通過其官方公眾號(hào)宣布,將于6月11日正式推出一款名為“豆包”的全新視頻生成模型。這一消息引起了廣泛關(guān)注,預(yù)示著視頻創(chuàng)作領(lǐng)域?qū)⒂瓉硪淮渭夹g(shù)革新。
據(jù)悉,豆包視頻生成模型具備多項(xiàng)令人矚目的“硬核”功能,旨在為用戶提供更加便捷、高效且富有創(chuàng)意的視頻制作體驗(yàn)。其首要亮點(diǎn)在于支持無縫多鏡頭敘事。借助先進(jìn)的模型結(jié)構(gòu)、多模態(tài)位置編碼以及多任務(wù)統(tǒng)一建模技術(shù),豆包能夠呈現(xiàn)出獨(dú)特且穩(wěn)定的多鏡頭表達(dá),為視頻創(chuàng)作增添更多層次感和動(dòng)態(tài)美。
豆包視頻生成模型還支持多動(dòng)作及隨心運(yùn)鏡功能。通過深入學(xué)習(xí)和理解豐富的場(chǎng)景、主體及行為動(dòng)作,該模型能夠精準(zhǔn)地響應(yīng)用戶的精細(xì)指令,流暢地生成包含多個(gè)主體、多種動(dòng)作以及復(fù)雜運(yùn)鏡效果的視頻內(nèi)容。這一功能無疑將極大地提升視頻創(chuàng)作的靈活性和表現(xiàn)力。
更豆包視頻生成模型在穩(wěn)定運(yùn)動(dòng)與真實(shí)美感方面也表現(xiàn)出色。其生成的畫面與主體動(dòng)態(tài)效果更加自然流暢,結(jié)構(gòu)性更好,崩壞率更低。用戶可以根據(jù)指令生成寫實(shí)、動(dòng)漫、影視、廣告等不同風(fēng)格的視頻內(nèi)容,滿足多樣化的創(chuàng)作需求。
火山引擎此次推出的豆包視頻生成模型,無疑將為視頻創(chuàng)作領(lǐng)域帶來一場(chǎng)革命性的變革。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,我們有理由相信,未來視頻創(chuàng)作將變得更加簡(jiǎn)單、高效且富有創(chuàng)意。