近期,人形機(jī)器人領(lǐng)域的獨(dú)角獸企業(yè)Figure AI突然宣布與OpenAI終止合作。這一決定由Figure AI的創(chuàng)始人兼首席執(zhí)行官Brett Adcock在社交媒體上公開宣布,他同時透露,F(xiàn)igure在自主研發(fā)端到端機(jī)器人AI方面取得了重大突破,并計(jì)劃在30天內(nèi)展示一些前所未有的創(chuàng)新。
回顧去年2月底,F(xiàn)igure AI曾宣布與OpenAI攜手合作,共同開發(fā)針對人形機(jī)器人的下一代AI模型。這一合作旨在結(jié)合OpenAI的研究實(shí)力與Figure AI在機(jī)器人軟硬件方面的深厚理解,以提升人形機(jī)器人的語言處理和推理能力。
然而,合作的破裂似乎并不意外。就在今年1月31日,OpenAI向美國專利商標(biāo)局提交了一份關(guān)于人形機(jī)器人的商標(biāo)申請。去年11月有消息傳出,OpenAI正在重建其曾在2020年解散的機(jī)器人團(tuán)隊(duì)。這些動向無疑加劇了雙方合作的緊張局勢。
OpenAI在AI研究和部署領(lǐng)域一直保持著對具身智能的高度關(guān)注。除了與Figure AI的合作外,OpenAI還投資了具身智能初創(chuàng)企業(yè)1X和Physical Intelligence。1X是一家總部位于挪威的實(shí)體機(jī)器人公司,其最新一代NEO產(chǎn)品已在歐洲和美國進(jìn)行實(shí)地測試,展現(xiàn)了較高的完成度和泛化操作能力。而Physical Intelligence則專注于研發(fā)能夠驅(qū)動多功能機(jī)器人的AI模型和算法,旨在實(shí)現(xiàn)實(shí)體世界中的智能化變革。
不過,OpenAI在進(jìn)軍具身智能領(lǐng)域的過程中也面臨著諸多挑戰(zhàn)。硬件制造與軟件開發(fā)之間的差異、如何有效整合軟硬件資源以及如何在投資者和參與者之間找到平衡等問題,都是OpenAI需要面對的難題。這些挑戰(zhàn)在一定程度上也影響了OpenAI與Figure AI之間的合作。
與此同時,中國AI創(chuàng)業(yè)公司DeepSeek推出的R1模型在近期搶走了不少風(fēng)頭。R1是一個高效的開源推理模型,全球用戶都可以免費(fèi)獲取、重新訓(xùn)練和定制。由于其寬松的MIT許可協(xié)議和免費(fèi)的應(yīng)用及網(wǎng)站服務(wù),R1在消費(fèi)者和企業(yè)市場中迅速走紅。微軟和亞馬遜等巨頭也急于將R1的變體引入自家云市場。相比之下,OpenAI的o3模型雖然強(qiáng)大,但運(yùn)行成本高昂,單次任務(wù)費(fèi)用超過1000美元,即使低計(jì)算版本的o3每個任務(wù)的成本也達(dá)到了約20美元。
DeepSeek-R1的性價比引發(fā)了人們對OpenAI投資回報率的懷疑。有用戶指出,DeepSeek R1 100%開源且比OpenAI o1便宜96.4%,同時提供類似的性能。這一對比無疑讓OpenAI在市場上的競爭力受到了質(zhì)疑。
在具身智能的實(shí)現(xiàn)過程中,大模型扮演著至關(guān)重要的角色。Figure AI在與OpenAI合作時采用的是分層決策的路徑,通過不同的神經(jīng)網(wǎng)絡(luò)協(xié)作來提高系統(tǒng)的靈活性和實(shí)時響應(yīng)能力。然而,F(xiàn)igure AI創(chuàng)始人Brett Adcock認(rèn)為,要在現(xiàn)實(shí)世界中大規(guī)模解決具身智能問題,必須建立端到端的人工智能模型,為特定硬件提供動力。這一觀點(diǎn)揭示了Figure AI與OpenAI在合作中的關(guān)鍵分歧。
據(jù)了解,實(shí)現(xiàn)具身智能有兩種主要路徑:分層決策和端到端的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。分層決策通過不同的神經(jīng)網(wǎng)絡(luò)協(xié)作來提高系統(tǒng)的靈活性,而端到端架構(gòu)則通過單一神經(jīng)網(wǎng)絡(luò)將輸入任務(wù)直接映射為控制信號,形成從輸入到輸出的無縫連接。然而,端到端模式需要海量數(shù)據(jù)驅(qū)動,這在實(shí)踐中具有一定的挑戰(zhàn)性。
智元機(jī)器人在研發(fā)機(jī)器人具身智能大模型方面也有著積極的探索。為了提升機(jī)器人的泛化能力和適應(yīng)復(fù)雜環(huán)境的能力,智元機(jī)器人計(jì)劃在2024年下半年部署上百臺自由機(jī)器人進(jìn)行端到端的數(shù)據(jù)采集。同時,AIDEA平臺也計(jì)劃在同年第四季度對外上線。
對于分層決策和端到端模型在具身智能實(shí)現(xiàn)中的優(yōu)勢與劣勢,樂聚機(jī)器人董事長冷曉琨表示,兩者各有千秋且未來可能會呈現(xiàn)融合發(fā)展的趨勢。他擔(dān)心的是不恰當(dāng)?shù)姆謱咏怦羁赡軙谛畔鬏斶^程中造成限制,導(dǎo)致模型泛化能力不足。因此,在目前的實(shí)踐中,樂聚機(jī)器人還未采用直接的端到端模型。