在科技界的一次重大突破中,OpenAI公司宣布了其最新成果GPT-4o的多模態(tài)圖像生成功能正式上線。這一創(chuàng)新意味著用戶無需再切換至OpenAI的DALL-E模型,即可直接在ChatGPT應(yīng)用中生成并修改圖片。這一消息迅速在社交媒體上引發(fā)轟動(dòng),尤其是吉卜力風(fēng)格的圖像在各大平臺上瘋傳,一股二次元風(fēng)潮席卷互聯(lián)網(wǎng)。
不僅僅是吉卜力風(fēng)格的圖像,GPT-4o的繪圖能力更在于其打破了傳統(tǒng)文生圖領(lǐng)域的格局。過去,Midjourney等垂類應(yīng)用在這一領(lǐng)域占據(jù)主導(dǎo)地位,但GPT-4o的加入為市場帶來了前所未有的挑戰(zhàn)。其強(qiáng)大的控圖能力讓用戶能夠通過自然語言與AI進(jìn)行多輪對話,精準(zhǔn)修改圖像,這在以往是難以想象的。
GPT-4o之所以能夠超越Midjourney等專業(yè)應(yīng)用,關(guān)鍵在于其獨(dú)特的策略。它并沒有直接比拼藝術(shù)領(lǐng)域的圖像生成質(zhì)量,而是在應(yīng)用門檻、修圖改圖以及跨學(xué)科能力上實(shí)現(xiàn)了彎道超車。GPT-4o通過提升自然語言對話能力,使得用戶無需掌握復(fù)雜的結(jié)構(gòu)化提示指令,只需用日??谡Z即可生成想要的圖像。例如,用戶只需說“幫我生成一幅清晨茂密森林里的彩虹瀑布”,GPT-4o就能迅速理解并生成相應(yīng)圖像。
GPT-4o還具備多模態(tài)能力,支持圖生圖和圖改圖功能。用戶可以上傳自己的圖片,無論是AI生成的還是自拍,都能進(jìn)行多次修改。這包括調(diào)整圖像的分辨率、色彩、背景等,甚至可以在原圖上不限次數(shù)地修改,直到滿意為止。這種靈活性使得GPT-4o在修圖方面遠(yuǎn)超Midjourney等傳統(tǒng)應(yīng)用。
GPT-4o的跨學(xué)科知識儲備同樣令人矚目。它不僅能夠生成各種風(fēng)格的圖像,還能解答數(shù)學(xué)問題、做物理題,甚至還原建筑草圖。這種全面的能力使得GPT-4o成為一個(gè)文理雙全的全能型選手,遠(yuǎn)超過局限于藝術(shù)領(lǐng)域的Midjourney。
GPT-4o的火爆出圈不僅吸引了大量用戶,也引起了同行的關(guān)注。Midjourney的CEO大衛(wèi)·霍爾茲在GPT-4o上線一周后便發(fā)文稱,Midjourney-v7即將上線,以應(yīng)對這一挑戰(zhàn)。然而,無論最終結(jié)果如何,GPT-4o已經(jīng)成功地沖出了設(shè)計(jì)師的小眾圈子,走進(jìn)了大多數(shù)人的工作場景。
GPT-4o之所以能夠如此受歡迎,關(guān)鍵在于其降低了應(yīng)用門檻并提升了模型產(chǎn)品的質(zhì)量和效能。用戶無需任何藝術(shù)功底和AI基礎(chǔ),只需像與朋友對話一樣交流即可修圖。同時(shí),GPT-4o的生圖和改圖速度更快,控制性更高,能夠完全還原用戶的指令。這使得GPT-4o不僅具有娛樂性,更具備了強(qiáng)大的工具屬性,可以應(yīng)用于電商、教育、建筑、設(shè)計(jì)等多個(gè)行業(yè)。