亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財經(jīng)媒體
科技·商業(yè)·財經(jīng)

谷歌Veo 2大升級:電影級視頻生成,文本音頻AI功能同步進化!

   時間:2025-04-10 15:52 作者:馮璃月

谷歌近期為其視頻AI技術(shù)Veo 2增添了一系列創(chuàng)新功能,旨在極大提升用戶制作電影質(zhì)感視頻及編輯真實素材的效率。這些新增功能目前已在谷歌云的Vertex AI平臺上開放預覽,與此同時,谷歌也對文本轉(zhuǎn)圖像模型Imagen 3及音頻相關(guān)的AI模型進行了重要的更新。

Veo 2的新功能亮點包括修復功能(inpainting)和外擴功能(outpainting)。據(jù)谷歌介紹,修復功能可以智能地移除視頻中不需要的背景圖像、標志或干擾元素,而外擴功能則能夠擴展原始視頻畫面,利用AI生成的片段填充新增空間,實現(xiàn)與原始畫面的自然融合,這一功能類似于Adobe在圖像處理中的生成式擴展。

此次更新還賦予了Veo 2用戶在生成視頻時結(jié)合電影拍攝技巧預設(shè)與文字描述的能力,從而精準指導鏡頭構(gòu)圖、拍攝角度和節(jié)奏。預設(shè)選項包括延時攝影效果、無人機視角以及模擬不同方向的鏡頭平移等,為用戶提供了更多創(chuàng)作自由度。

Veo 2還引入了插值功能,該功能能夠在兩個靜態(tài)圖像之間創(chuàng)建平滑的視頻過渡,為視頻開頭和結(jié)尾序列添加新的幀,進一步增強視頻的流暢度和專業(yè)感。

值得注意的是,Adobe的競爭對手產(chǎn)品Firefly視頻模型也推出了類似的生成式AI視頻擴展功能,并在Premiere Pro中上線。谷歌在Veo 2的輸出中加入了SynthID數(shù)字歸屬水印,以保障內(nèi)容的原創(chuàng)性,這與Adobe的內(nèi)容憑證系統(tǒng)有異曲同工之妙。然而,Adobe明確表示其工具完全適用于商業(yè)用途,因為它們基于授權(quán)和公有領(lǐng)域內(nèi)容訓練,而谷歌在訓練AI模型時則大量使用了網(wǎng)絡(luò)抓取的內(nèi)容。

在文本轉(zhuǎn)圖像模型方面,谷歌對Imagen 3的編輯功能進行了升級,據(jù)稱可以顯著提升移除物體的效果,使處理后的圖像看起來更加自然。Veo 2和Imagen 3已被歐萊雅、卡夫亨氏等公司用于營銷內(nèi)容制作,顯著縮短了制作周期。例如,卡夫亨氏的數(shù)字體驗負責人賈斯汀·托馬斯表示,原本需要八周才能完成的任務(wù),現(xiàn)在僅需八小時即可完成。

在音頻領(lǐng)域,谷歌推出了文本轉(zhuǎn)音樂模型Lyria的私人預覽版,并為合成語音模型Chirp 3新增了“即時定制語音”功能。谷歌表示,Chirp 3現(xiàn)在能夠僅從10秒的音頻輸入中生成逼真的定制語音。谷歌還推出了一項新的轉(zhuǎn)錄功能預覽,該功能能夠識別并分離多人對話中的不同說話者,為多方參與的談話提供更清晰的轉(zhuǎn)錄結(jié)果。

這一系列更新只是谷歌近期宣布的AI相關(guān)消息的一部分。谷歌還透露,其效率優(yōu)化型Flash模型的最新版本Gemini 2.5 Flash即將登陸Vertex AI,該版本能夠根據(jù)任務(wù)的復雜程度自動調(diào)整處理時間,從而更快地為簡單請求提供結(jié)果。

谷歌本周還將更新其面向企業(yè)的Agentic AI工具,使AI代理能夠在不同平臺(如PayPal和Salesforce)之間無縫溝通并執(zhí)行任務(wù)。同時,谷歌云市場也將推出一個新板塊,供企業(yè)瀏覽和購買由第三方谷歌合作伙伴構(gòu)建的AI代理。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容