在科技界掀起軒然大波的AI新秀Manus,近日成為了眾人矚目的焦點。從一夜爆紅到一碼難求,再到對其豪華宣發(fā)策略的質疑,整個過程中,F(xiàn)OMO(錯失恐懼癥)情緒與理性警惕交織,為傳播學提供了一個生動的研究案例。
近年來,AI行業(yè)似乎總是以“爆炸性新聞”驅動資訊模式。對于內行人而言,這種熱度早已褪去神秘面紗;而外行人則仍可能對此類消息感到驚奇。然而,不可否認的是,在這股持續(xù)的“爆炸”浪潮中,偶爾也會混雜著真正具有劃時代意義的突破。
Manus無疑屬于后者,它堪稱AI Agent領域的里程碑事件,盡管在文章結尾我會添加一個補充說明。首先,讓我們通過一個演示效果來領略Manus的實力:
在短短一個小時內,Manus開發(fā)了一款模擬谷歌CEO決策的文字互動游戲。玩家可以扮演谷歌CEO,在公司的歷史轉折點做出決策,影響公司的資源和最終結局。從提出想法到游戲成型,僅用一句話的時間,這便是AI Agent的魔力。
與傳統(tǒng)的對話式AI不同,AI Agent不再局限于提供信息層面的答案,而是能夠自主操作電腦完成具體的工作任務,如編寫程序、設計網(wǎng)頁、撰寫報告、篩選簡歷等。它能夠獨立解決過程中遇到的各種難題,并交付工作成果。當然,也存在例外情況,但我們先按下不表。
目前,主流的AI Agent服務不僅數(shù)量有限,而且價格昂貴。例如,ChatGPT Operator的Pro會員費用高達每月200美元,而主打編程市場的AI工程師產品Devin更是每月需要500美元。相比之下,由中國大模型團隊Monica開發(fā)的Manus目前處于免費測試階段,單任務成本僅為2美元,是OpenAI的十分之一,且在基準測試排行榜上已超越OpenAI,成為全球最強。
在獲得邀請碼后,筆者親身體驗了Manus的強大功能,并在短時間內耗盡了其單日計算資源。幾個實測案例進一步證明了Manus的實力:
首先,筆者請Manus制作了一個linktree風格的個人主頁。它迅速搜集了筆者的資料信息,并基于linktree的設計風格編寫了網(wǎng)頁代碼。半小時后,一個簡單卻完美的作品呈現(xiàn)在眼前。
接下來,筆者用Manus幫助一位工程師群友解決了阿特拉斯機械臂的維護問題。它自行下載并分析了官方文檔,創(chuàng)建了解決問題的程序,直接省去了昂貴的售后費用。
筆者還讓Manus制作了一個國家的極簡編年史,并增加了漫畫表現(xiàn)和網(wǎng)頁設計的要求。盡管配色略顯尷尬(AI的審美仍需強調),但它成功地將英國歷史分成了不同時代,并繪制了SVG圖片,呈現(xiàn)在HTML網(wǎng)頁端。
在另一個測試中,筆者請Manus制作一款以原神角色為圖標的消消樂游戲。然而,在搜集原神圖片素材時,它遇到了障礙,因無法注冊網(wǎng)盤賬號而無法下載資源。這顯示了AI在面對網(wǎng)絡限制時的無奈。
盡管Manus在解決復雜問題時仍存在細節(jié)上的不足,但這些實測案例已充分展示了其在現(xiàn)階段的能力和局限性。它不再局限于操作瀏覽器,而是具有沙盒環(huán)境,能在完成工作前進行測試,確保質量后再交付。然而,它也受限于互聯(lián)網(wǎng)的數(shù)據(jù)邊界,無法自給自足地生產資源。
在文書類測試中,Manus同樣表現(xiàn)出色。例如,筆者請它根據(jù)B站最熱門的10個星見雅(游戲角色)視頻給出操作技巧。它花費了一個多小時的時間觀看了所有視頻,并精煉出了筆者所需的材料,準確性極高。
在另一個測試中,筆者讓Manus研究PolyMarket的套利可能。它兢兢業(yè)業(yè)地做足了功課,列出了四個套利機會,為筆者提供了明確的投資策略。
Manus的回放功能也是其亮點之一。它展示了AI在解決問題過程中的思維鏈,為使用者提供了寶貴的啟發(fā)。這種智能資產不僅可以作為工作成果,還可以扮演人類的老師。
在評價Manus為AI Agent行業(yè)的DeepSeek時刻時,需要添加一個補充說明:這是DeepSeek-V2時刻的升級版。2024年5月,DeepSeek開源了V2版本的模型,雖然當時因其能力一般而未引起足夠重視,但V3和R1的連續(xù)發(fā)布徹底顛覆了整個大模型市場的成本邏輯。正如《流浪地球》所言:“最初,沒有人在意這場災難……”AI技術的發(fā)展是連續(xù)的,而每一次的信號強度都決定了后續(xù)的突破深度。Manus在將AI Agent服務從專業(yè)場景推向通用場景的歷史轉折點上,無疑是一個開創(chuàng)性的品牌。