隨著人工智能技術(shù)的迅猛發(fā)展,AI Agent領(lǐng)域正逐漸成為科技界的新寵。近期,兩大重量級玩家Manus與MiniMax相繼在Agent賽道上邁出了重要步伐,引發(fā)了廣泛關(guān)注。
Manus早已宣布向公眾全面開放注冊,無需等待名單,為用戶提供了即刻體驗(yàn)其Agent服務(wù)的機(jī)會(huì)。與此同時(shí),MiniMax也不甘落后,在其AI助手中悄然開啟了Agent的內(nèi)測。內(nèi)測頁面顯示,MiniMax為用戶提供了“標(biāo)準(zhǔn)”與“深度”兩種模式選擇,以滿足不同需求。其中,“深度”模式以其深度推理能力和高質(zhì)量的任務(wù)完成度,吸引了眾多測試者的目光。無論是研究型任務(wù)如文檔事實(shí)核查,還是綜合性任務(wù)如搭建網(wǎng)站、規(guī)劃旅游行程,MiniMax Agent都展現(xiàn)出了強(qiáng)大的實(shí)力。
MiniMax還加入了“當(dāng)前進(jìn)程”視窗,讓用戶能夠?qū)崟r(shí)查看Agent的工作流。這一功能使得MiniMax Agent在執(zhí)行任務(wù)時(shí)更加透明,用戶能夠清晰地看到每一步的進(jìn)展。MiniMax對多模態(tài)技術(shù)的重視也體現(xiàn)在其產(chǎn)品和服務(wù)中。公司自主研發(fā)了文本、語音、音樂、視頻、圖像等多種模態(tài)的通用大模型,并基于此推出了多款A(yù)I原生應(yīng)用,如Chatbot類智能助手MiniMax、海螺視頻等。
在語音模型方面,MiniMax同樣展現(xiàn)出了強(qiáng)大的實(shí)力。其最新發(fā)布的Speech 02模型具有強(qiáng)大的泛化能力,能夠駕馭32種語種、不同口音、不同情緒的人聲。在全球語音基準(zhǔn)測評榜單中,MiniMax Speech 02名列前茅,表現(xiàn)超越了OpenAI等模型。在MiniMax Agent的示例中,用戶可以要求生成一個(gè)3分鐘的通用冥想引導(dǎo)音頻,并指定使用溫柔的女性聲音。這一功能不僅展示了MiniMax在語音合成方面的技術(shù)實(shí)力,也體現(xiàn)了其在滿足用戶個(gè)性化需求方面的努力。
在AI Agent賽道上,MiniMax并非孤軍奮戰(zhàn)。智譜AI、月之暗面、階躍星辰等公司也在積極探索這一領(lǐng)域。其中,智譜AI已推出了多款能夠模擬人類操作手機(jī)、計(jì)算機(jī)等電子設(shè)備的智能體,并支持跨應(yīng)用操作。階躍星辰則重點(diǎn)押注智能終端Agent,同樣強(qiáng)調(diào)要充分發(fā)揮多模態(tài)的優(yōu)勢。創(chuàng)業(yè)新秀如Manus、Genspark、Lovart等也在這一賽道上嶄露頭角。
隨著越來越多玩家的加入,AI Agent領(lǐng)域正逐漸形成一個(gè)多元化的競爭格局。然而,對于這一領(lǐng)域的入局者來說,目前仍處于嘗試定義問題并初步解決的階段。因此,如何把產(chǎn)品做好,成為他們共同面臨的重要課題。在科技行業(yè)的眼中,2025年有望成為AI Agent元年。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,AI Agent領(lǐng)域有望迎來更加廣闊的發(fā)展前景。