在寶可夢游戲的世界里,一項新的里程碑誕生了。谷歌的Gemini 2.5 Pro大模型在直播中成功通關《寶可夢藍》,這一成就迅速引起了廣泛關注,谷歌CEO劈柴哥興奮地在社交平臺上宣布了這一喜訊,并分享了通關時的珍貴畫面。
Gemini 2.5 Pro的這一壯舉,無疑讓眾多網友沸騰。大模型不僅在科技領域取得了突破,還在游戲世界中留下了自己的足跡。網友們紛紛感嘆,Gemini的自我介紹里現在可以自豪地加上一條:首個成為寶可夢聯(lián)盟冠軍,并登入《寶可夢藍》名人堂的大模型。
回顧Gemini的通關之路,可謂是一路坎坷。一年前的舊模型Claude 3.5還只能勉強走出新手村,到達常磐森林。而兩個月前,Claude 3.7雖然能夠擊敗道館主,但也未能成功通關。如今,Gemini 2.5 Pro終于完成了這一壯舉。
在直播中,我們可以看到Gemini每動一步都深思熟慮。左邊的文本框里詳細展示了Gemini每個行動背后的思考過程。在完成一長串行動后,Gemini 2.5 Pro在目標位置足足思考了40多秒,消耗了76011個token,才規(guī)劃出下一步的行動。這種深思熟慮的態(tài)度,雖然讓直播過程顯得有些無聊,但也展現了Gemini在游戲中的專注和策略。
盡管Gemini已經成為了聯(lián)盟冠軍,但在寶可夢這款主要面向兒童和青少年的游戲中,大模型的表現仍然明顯不如人類。這主要是因為大模型“視力不佳”,難以解讀Game Boy屏幕中展現的低分辨率、像素化的世界。同時,游戲中的二維地圖也對大模型構成了挑戰(zhàn)。然而,在游戲中偏文本的部分,大模型已經展現出了驚人的表現。例如,在寶可夢對戰(zhàn)中,大模型能夠迅速理解游戲提示,并將這些知識整合到自己的戰(zhàn)斗策略中。
谷歌的這一突破,無疑為大模型在游戲領域的應用開辟了新的道路。未來,或許會有更多的大模型加入到游戲世界中,與人類玩家一較高下。而測試大模型的基準,也許真的會變成誰能更快通關寶可夢了。