谷歌的人工智能領(lǐng)域傳來振奮人心的消息,其最新研發(fā)的Gemini 2.5 Pro模型在一款經(jīng)典電子游戲中取得了歷史性成就——成功攻克了發(fā)布于29年前的《寶可夢藍》。
這一突破性進展由谷歌首席執(zhí)行官桑達爾·皮查伊在社交媒體上激動宣布:“真是令人驚嘆!Gemini 2.5 Pro已經(jīng)成功通關(guān)《寶可夢藍》!”這場名為“Gemini Plays Pokemon”的直播活動,由一位非谷歌員工的30歲軟件工程師Joel Z發(fā)起,卻獲得了谷歌高層的鼎力支持。
據(jù)悉,早在直播活動前一個月,谷歌AI Studio的產(chǎn)品負責(zé)人洛根·基爾帕特里克就已透露,Gemini在《寶可夢》系列游戲上取得了顯著進展,并已斬獲第五個徽章。相比之下,當(dāng)前表現(xiàn)第二的模型僅獲得三個徽章,盡管它們使用的是不同的代理框架。皮查伊還幽默地表示:“我們正在研發(fā)API,即‘人工寶可夢智能’?!?/p>
為何谷歌選擇《寶可夢》作為挑戰(zhàn)對象?這背后有其深意。早在今年2月,Anthropic公司便展示了其Claude AI模型在《寶可夢紅》中的卓越表現(xiàn),強調(diào)Claude的“深度思考和代理訓(xùn)練”能力使其在處理復(fù)雜任務(wù)時更具優(yōu)勢。然而,盡管Claude表現(xiàn)出色,卻似乎未能完全通關(guān)《寶可夢紅》。這是否意味著Gemini在游戲領(lǐng)域的能力更勝一籌?對此,Joel Z在Twitch頁面上提醒觀眾:“請勿將此次成就視為衡量大型語言模型(LLM)在《寶可夢》游戲中表現(xiàn)的唯一標準。Gemini和Claude使用不同的工具和接收到的信息差異較大,因此無法進行直接比較?!?/p>
值得注意的是,兩款A(yù)I模型在玩游戲時都需要借助代理框架。這些框架為模型提供帶有額外信息的游戲截圖,幫助模型做出決策,并按下與AI指令相對應(yīng)的按鈕。盡管在幫助Gemini完成游戲的過程中,Joel Z進行了一些“開發(fā)干預(yù)”,但他堅稱這并非作弊,而是為了提升Gemini的整體決策和推理能力。
“我的干預(yù)并未涉及給出具體提示詞或為特定挑戰(zhàn)提供攻略或直接指令。”Joel Z解釋道,“唯一接近這種情況的是,我告訴Gemini需要與火箭隊小兵對話兩次才能獲得升空鑰匙,這實際上是一個在《寶可夢黃》中被修復(fù)的漏洞。”他進一步表示,“Gemini Plays Pokémon仍在積極開發(fā)中,其框架也在不斷演進和完善?!?/p>