谷歌近期推出了一款創(chuàng)新的AI圖像生成工具——Whisk,這款工具讓用戶能夠以圖像為靈感,輕松創(chuàng)造出新的視覺作品。與以往需要繁瑣文字描述的方式不同,Whisk允許用戶直接通過上傳其他圖像來設(shè)定生成圖像的主題、場景和風(fēng)格。
在使用Whisk的過程中,用戶能夠分別為主題、場景和風(fēng)格選擇多張圖像作為創(chuàng)作的基礎(chǔ)。如果一時(shí)找不到合適的圖像,還可以點(diǎn)擊一個類似骰子的圖標(biāo),讓谷歌自動推薦一些圖像作為參考。這些自動生成的圖像同樣具備高度的創(chuàng)意性。用戶還擁有在最終階段添加文字描述的權(quán)利,用以進(jìn)一步細(xì)化圖像特征,盡管這一步并非強(qiáng)制。
Whisk在接收到用戶的圖像提示后,會迅速生成相應(yīng)的圖像,并為每張圖像配備一段描述性文字。用戶可以根據(jù)自己的喜好選擇保存或下載這些圖像。如果對生成的圖像有所不滿,用戶可以通過繼續(xù)添加文字描述或修改現(xiàn)有的圖像提示來進(jìn)行調(diào)整,整個過程十分靈活。
谷歌在官方博文中指出,Whisk的核心理念是提供快速而直觀的視覺探索體驗(yàn),而非追求像素級的精確修改。公司同時(shí)承認(rèn),由于AI技術(shù)的局限性,Whisk生成的圖像可能會出現(xiàn)偏差,因此特意設(shè)計(jì)了可編輯的提示功能,讓用戶能夠自主調(diào)整創(chuàng)作方向。
據(jù)初步體驗(yàn)者反饋,Whisk的使用過程充滿樂趣。雖然生成的圖像偶爾會出現(xiàn)一些意想不到的效果,但得益于其易于迭代修改的特性,用戶能夠輕松調(diào)整出滿意的作品。圖像生成的速度也相當(dāng)可觀,通常在幾秒鐘內(nèi)就能完成。
Whisk背后的技術(shù)支持是谷歌最新發(fā)布的Imagen 3圖像生成模型。這款模型不僅提升了圖像生成的效率,還在一定程度上增強(qiáng)了圖像的創(chuàng)意性和多樣性。