滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 科技人物 > 正文內(nèi)容

谷歌Gemini與Veo模型融合，邁向全能AI助手新時(shí)代？

時(shí)間：2025-04-13 10:17 作者：顧青青

谷歌DeepMind的首席執(zhí)行官Demis Hassabis在近期的一次播客訪談中，揭示了谷歌AI發(fā)展的最新動(dòng)向。在與領(lǐng)英聯(lián)合創(chuàng)始人Reid Hoffman共同主持的節(jié)目Possible中，Hassabis透露，谷歌正計(jì)劃將Gemini AI模型與Veo視頻生成模型進(jìn)行深度整合，旨在增強(qiáng)Gemini對(duì)物理世界的認(rèn)知與理解能力。

Hassabis強(qiáng)調(diào)，Gemini從一開(kāi)始就被設(shè)計(jì)為具備多模態(tài)特性的基礎(chǔ)模型，這一決策背后承載著谷歌構(gòu)建一個(gè)能夠在實(shí)際生活中為用戶提供切實(shí)幫助的通用數(shù)字助手的宏偉愿景。

當(dāng)前，AI領(lǐng)域正邁向“全能”模型的新紀(jì)元，這類模型能夠跨越圖像、文本、音頻等多種媒體形式，實(shí)現(xiàn)信息的全面理解和整合。谷歌的Gemini模型便是這一趨勢(shì)的佼佼者，它不僅擅長(zhǎng)圖像與文本的生成，還具備音頻創(chuàng)作的能力。與此同時(shí)，OpenAI的ChatGPT模型也已進(jìn)化至能夠繪制圖像，包括獨(dú)具宮崎駿風(fēng)格的藝術(shù)作品，展現(xiàn)了AI在藝術(shù)領(lǐng)域的新探索。亞馬遜同樣不甘落后，宣布將在今年晚些時(shí)候推出一款能夠?qū)崿F(xiàn)“任意到任意”轉(zhuǎn)換的模型，進(jìn)一步拓寬了AI的應(yīng)用邊界。

為了實(shí)現(xiàn)這些“全能”模型的訓(xùn)練，海量的數(shù)據(jù)資源是必不可少的。據(jù)Hassabis透露，Veo視頻模型的數(shù)據(jù)主要源自谷歌旗下的YouTube平臺(tái)。通過(guò)大量觀看YouTube視頻，Veo 2得以深入理解世界的物理規(guī)律，從而提升了其視頻生成與內(nèi)容理解的準(zhǔn)確性。此前，谷歌已向外界透露，其模型可能會(huì)依據(jù)與YouTube創(chuàng)作者達(dá)成的協(xié)議，使用部分YouTube內(nèi)容進(jìn)行訓(xùn)練。為了獲取更多數(shù)據(jù)以優(yōu)化AI模型，谷歌去年還對(duì)其服務(wù)條款進(jìn)行了部分調(diào)整。

更多>同類內(nèi)容

AI編程助手軟件調(diào)試能力如何？微軟研究揭示其短板

04-13

VR/AR/XR文本輸入技術(shù)繁多，但距實(shí)體鍵盤仍有差距

04-13

直播電商再添助力，謙尋控股為外貿(mào)企業(yè)開(kāi)啟“中國(guó)制造”直播快車道

04-13

江淮X8 E家新增頂配車型上市，家馨版起售價(jià)18.98萬(wàn)元！

04-13

OpenAI前員工力挺馬斯克：公司重組背棄非營(yíng)利初心？

04-13

Redmi K80一碰秒傳大揭秘：手機(jī)電腦互聯(lián)，效率翻倍新體驗(yàn)！

04-12

2025電影市場(chǎng)火爆！《哪吒之魔童鬧?！奉I(lǐng)跑，票房已超150億大關(guān)

04-12

《逆水寒》手游2.3.3版更新：PC桌面版來(lái)襲，游戲畫(huà)面再升級(jí)！

04-12

智己汽車IMOS 3.6.0新功能搶先看：哨兵模式手機(jī)可控，駕駛體驗(yàn)再升級(jí)

04-12

凱迪拉克LYRIQ-V上海車展首發(fā)，純電SUV加速進(jìn)“3秒俱樂(lè)部”

04-12

微軟發(fā)布OOB更新，緊急修復(fù)Active Directory組策略顯示異常

04-12

iPhone漲價(jià)風(fēng)波：9天狂漲500元，蘋果中國(guó)如何應(yīng)對(duì)？

04-12

小米R(shí)EDMI A27U節(jié)能版顯示器上市，4K高清僅售1189.15元起！

04-12

一加13T真機(jī)搶先看：小屏大能量，6000mAh電池本月來(lái)襲！

04-12

中國(guó)航天科技集團(tuán)一日三捷，火箭衛(wèi)星發(fā)動(dòng)機(jī)試驗(yàn)齊傳佳音