亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

字節(jié)新模型OmniHuman:圖片音頻融合,AI視頻生成更高效!

   時(shí)間:2025-02-08 21:47 來源:北青網(wǎng)作者:柳晴雪

字節(jié)跳動(dòng)旗下的即夢(mèng)AI近日在官方社交媒體平臺(tái)上揭曉了一項(xiàng)即將上線的新功能,通過一段引人入勝的預(yù)告視頻,向公眾展示了其最新研發(fā)的多模態(tài)視頻生成模型——OmniHuman。該技術(shù)的問世,預(yù)示著用戶僅需憑借一張圖片和一段音頻,便能輕松制作出栩栩如生、質(zhì)量上乘的AI視頻,這無疑將為AI短片制作領(lǐng)域帶來一場(chǎng)效率與質(zhì)量的雙重革命。

據(jù)OmniHuman的技術(shù)主頁介紹,這一模型由字節(jié)跳動(dòng)自主研發(fā),并采用了閉源策略,確保了技術(shù)的獨(dú)特性和安全性。它支持多種尺寸的圖片輸入,無論是肖像、半身還是全身照,都能根據(jù)用戶提供的音頻內(nèi)容,讓視頻中的人物做出與音頻相匹配的動(dòng)作,如演講、歌唱、演奏樂器以及行走等。尤為OmniHuman在解決人物視頻生成中常見的手勢(shì)失真問題上,相較于現(xiàn)有技術(shù)有了顯著的提升。該技術(shù)還能處理動(dòng)漫、3D卡通等非真人圖片輸入,生成的視頻能夠完美保留原圖的特定風(fēng)格和運(yùn)動(dòng)模式。

從技術(shù)主頁展示的演示效果來看,OmniHuman所生成的視頻在自然度方面已經(jīng)達(dá)到了相當(dāng)高的水平。然而,為了防范技術(shù)被濫用,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)明確表示,OmniHuman將不會(huì)對(duì)外開放下載,從而在一定程度上保障了技術(shù)的合法合規(guī)使用。

即夢(mèng)AI的相關(guān)負(fù)責(zé)人透露,盡管OmniHuman在目前的測(cè)試中已經(jīng)展現(xiàn)出了良好的性能,但在生成接近影視級(jí)別的真實(shí)視頻方面,仍有進(jìn)一步提升的空間。因此,該模型支持的多模態(tài)視頻生成功能將在即夢(mèng)平臺(tái)上以小規(guī)模內(nèi)測(cè)的形式進(jìn)行調(diào)優(yōu),并逐步向更廣泛的用戶開放。同時(shí),即夢(mèng)AI還將為這一功能設(shè)置嚴(yán)格的安全審核機(jī)制,并對(duì)輸出的視頻添加水印,以此提醒用戶注意視頻的合法合規(guī)使用,確保AI技術(shù)能夠發(fā)揮正面、積極的作用,助力視頻創(chuàng)作者更好地實(shí)現(xiàn)創(chuàng)意和想象力的表達(dá)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容