近期,一款名為Manus的AI Agent產(chǎn)品在網(wǎng)絡(luò)上引發(fā)了廣泛關(guān)注。從一夜爆紅到一碼難求,再到對(duì)其高額宣發(fā)費(fèi)用的質(zhì)疑,整個(gè)過程中,F(xiàn)OMO(錯(cuò)失恐懼癥)情緒與直覺警惕相互交織,構(gòu)成了一個(gè)極具研究價(jià)值的傳播學(xué)案例。
近年來,AI行業(yè)似乎總是以“爆炸性”新聞的形式出現(xiàn)在公眾視野中。對(duì)于這一領(lǐng)域有所了解的人來說,這些新聞已經(jīng)失去了新鮮感;而對(duì)于門外漢,則依然感到新奇不已。不過,在這股“天天炸裂”的浪潮中,也確實(shí)不乏真正具有劃時(shí)代意義的突破。
Manus,無疑是這些突破中的佼佼者。它被譽(yù)為AI Agent行業(yè)的DeepSeek時(shí)刻(此處特指具有里程碑意義的轉(zhuǎn)折點(diǎn)),盡管在文章結(jié)尾,筆者將對(duì)此評(píng)價(jià)稍作補(bǔ)充。
為了直觀展示Manus的能力,我們先來看一個(gè)演示案例:要求Manus開發(fā)一款文字互動(dòng)游戲,玩家可扮演谷歌CEO,通過模擬公司歷史上的重要決策,既能享受游戲樂趣,又能深入了解公司文化。
僅用了一個(gè)小時(shí)左右,Manus便完成了這款谷歌CEO模擬器的網(wǎng)頁游戲開發(fā)。游戲完成度高,玩家可自選難度,面對(duì)谷歌歷史上的各個(gè)轉(zhuǎn)折點(diǎn)做出決策,從而影響公司的資源變化和最終結(jié)局。一個(gè)小時(shí)內(nèi),用一句話,做出一款游戲,這便是AI Agent的強(qiáng)大之處。
與傳統(tǒng)的對(duì)話式AI不同,AI Agent不再局限于提供信息層面的答案,而是能夠操作電腦完成更加具體的工作任務(wù),如編寫程序、制作網(wǎng)頁、整理報(bào)告、篩選簡歷等。它能自主解決過程中遇到的各種困難,并交付工作結(jié)果。當(dāng)然,也存在例外情況,但我們先按下不表。
目前,主流的AI Agent服務(wù)并不多,且價(jià)格普遍較高。例如,ChatGPT Operator的Pro會(huì)員費(fèi)用為每月200美元,而主打編程市場的AI工程師產(chǎn)品Devin,每月費(fèi)用更是高達(dá)500美元。相比之下,由中國大模型團(tuán)隊(duì)Monica開發(fā)的Manus,目前處于免費(fèi)測試階段,單任務(wù)成本僅需2美元,僅為OpenAI的十分之一。同時(shí),在基準(zhǔn)測試排行榜上,Manus已經(jīng)超越OpenAI,成為全球最強(qiáng)。
筆者有幸獲得邀請(qǐng)碼,并在短時(shí)間內(nèi)耗盡了Manus的單日計(jì)算資源。其效果之震撼,令人興奮不已。以下是幾個(gè)實(shí)測案例:
首先,筆者讓Manus制作了一張linktree風(fēng)格的個(gè)人主頁。它將任務(wù)拆分為多個(gè)步驟,搜集全網(wǎng)資料信息,包括筆者在各個(gè)平臺(tái)的鏈接及代表作,然后基于linktree的設(shè)計(jì)風(fēng)格編寫網(wǎng)頁代碼。半小時(shí)后,一個(gè)符合要求、交互無問題的作品便呈現(xiàn)在眼前。如果想做得更美觀,還可繼續(xù)寫提示詞讓它修改。
第二個(gè)測試案例中,筆者用Manus幫助一位工程師群友解決了實(shí)際問題。他在工廠負(fù)責(zé)維護(hù)的阿特拉斯機(jī)械臂出現(xiàn)故障,找售后需花費(fèi)數(shù)千元。于是,他直接給出了一段描述故障的文字,讓Manus看看怎么處理。Manus自行前往阿特拉斯官網(wǎng)下載文檔,讀完之后找到關(guān)鍵內(nèi)容,仔細(xì)分析并創(chuàng)建程序。最終,筆者將代碼發(fā)給朋友,雖有小瑕疵但手工修改后完全可用,成功省掉了一次售后呼叫。
第三個(gè)測試案例中,筆者應(yīng)微博讀者要求,讓Manus制作了一個(gè)國家的極簡編年史,并增加了漫畫表現(xiàn)和網(wǎng)頁設(shè)計(jì)的要求。最終作品配色雖有些不盡如人意(AI缺乏審美需反復(fù)強(qiáng)調(diào)),但已將英國歷史分為十個(gè)不同時(shí)代,并基于時(shí)代風(fēng)貌繪制了SVG圖片,呈現(xiàn)在HTML網(wǎng)頁端。無論是作為課外教案還是作品預(yù)覽,都極為便捷。
在最后一個(gè)案例中,筆者讓Manus制作一款消消樂游戲,圖標(biāo)需使用原神角色。然而,在嘗試搜集原神圖片素材時(shí),它遇到了障礙——被一個(gè)網(wǎng)盤會(huì)員制度攔住,無法注冊(cè)賬號(hào)下載資源。于是,它發(fā)出了接管請(qǐng)求。本著讓AI Agent獨(dú)立完成工作的原則,筆者稍改需求,改用科技公司logo做游戲圖標(biāo)。很快,一個(gè)帶積分的消消樂游戲便制作完成,玩起來也算順暢。
通過這些實(shí)測案例,我們不難發(fā)現(xiàn)AI Agent在現(xiàn)階段的能力和局限。Manus已具備沙盒環(huán)境,能在完成工作前自行測試,驗(yàn)收合格再做交付。但受限于互聯(lián)網(wǎng)數(shù)據(jù)邊界,若網(wǎng)絡(luò)資源不足,它無法自給自足生產(chǎn)資源。在解決復(fù)雜問題時(shí),細(xì)節(jié)方面的缺失仍存在。
筆者還進(jìn)行了一些偏文書類的測試,用以對(duì)比AI Agent的特點(diǎn)。例如,讓Manus根據(jù)B站最熱門的10個(gè)星見雅(游戲角色)視頻,給出操作技巧。它足足看完了10個(gè)視頻,再精煉成所需材料,相當(dāng)準(zhǔn)確。同樣任務(wù)若交給聯(lián)網(wǎng)大模型,雖也能完成,但幻覺產(chǎn)生概率較高,在“老實(shí)”程度上不及AI Agent。
再如,讓Manus研究PolyMarket的套利可能。它兢兢業(yè)業(yè)做足功課,列出四個(gè)套利機(jī)會(huì)。從回放來看,它每次都從最基礎(chǔ)信息切入,先了解PolyMarket是什么,再分析預(yù)測市場玩法,結(jié)合平臺(tái)規(guī)則構(gòu)建風(fēng)險(xiǎn)策略。標(biāo)準(zhǔn)的實(shí)習(xí)生作風(fēng),任勞任怨,踏實(shí)耐用。
Manus的回放設(shè)計(jì)也是其亮點(diǎn)之一。它類似于推理模型暴露思維鏈的選擇,很多時(shí)候,AI的思考過程比答案本身更能給人啟發(fā)。Manus的每個(gè)任務(wù)都有回放功能,且可被分享。它在解決問題過程中所展現(xiàn)的手段,完全稱得上是另一種形式的智能資產(chǎn),可扮演人類老師。
筆者之所以評(píng)價(jià)Manus為AI Agent行業(yè)的DeepSeek時(shí)刻(需打補(bǔ)丁為DeepSeek-V2時(shí)刻),是因?yàn)镈eepSeek在開源V2版本模型時(shí)并未引起太多關(guān)注,僅因價(jià)格便宜且模型能力一般,被認(rèn)為只是來打價(jià)格戰(zhàn)。直到DeepSeek-V3和R1的連續(xù)發(fā)布,人們才意識(shí)到整個(gè)大模型市場的成本邏輯被顛覆。正如《流浪地球》所言:“最初,沒有人在意這場災(zāi)難,這不過是一場山火,一次旱災(zāi),一個(gè)物種的滅絕,一座城市的消失,直到這場災(zāi)難和每個(gè)人息息相關(guān)?!盇I技術(shù)的發(fā)展是連續(xù)性的,而每一次的信號(hào)強(qiáng)度都決定了后面的突破深度。Manus在將AI Agent服務(wù)從專業(yè)場景帶向通用場景的歷史轉(zhuǎn)折點(diǎn)上,無疑是開山立派的創(chuàng)始品牌。