近期,一項(xiàng)由多家頂尖機(jī)構(gòu)聯(lián)合研發(fā)的創(chuàng)新成果——BeamDojo強(qiáng)化學(xué)習(xí)框架,成功賦能人形機(jī)器人,使其在復(fù)雜地形上展現(xiàn)出前所未有的敏捷與穩(wěn)定性。這一突破性進(jìn)展由上海AI實(shí)驗(yàn)室攜手上海交通大學(xué)、浙江大學(xué)、香港大學(xué)及香港中文大學(xué)共同宣布。
在BeamDojo框架的驅(qū)動(dòng)下,宇樹科技的旗艦人形機(jī)器人G1,不僅在模擬環(huán)境中大放異彩,更在現(xiàn)實(shí)世界中驗(yàn)證了其卓越的地形適應(yīng)能力。G1能夠輕松穿越如平衡木、梅花樁等極具挑戰(zhàn)性的地形,甚至在間距不一、寬度僅約20厘米的踏腳石上穩(wěn)健前行。
尤為引人注目的是,G1不僅正行穩(wěn)健,還能倒退行走,甚至在背負(fù)6千克重物、面臨外力干擾的情況下,依然能夠順利完成挑戰(zhàn),展現(xiàn)了其強(qiáng)大的平衡與控制能力。
BeamDojo框架的創(chuàng)新之處在于其獨(dú)特的兩階段強(qiáng)化學(xué)習(xí)訓(xùn)練策略。第一階段,機(jī)器人在平地進(jìn)行基礎(chǔ)訓(xùn)練,同時(shí)接收目標(biāo)地形的感知信息;第二階段,則切換至實(shí)際任務(wù)地形,進(jìn)一步優(yōu)化策略。針對(duì)人形機(jī)器人多邊形腳掌的特點(diǎn),研究團(tuán)隊(duì)設(shè)計(jì)了基于采樣的落腳點(diǎn)獎(jiǎng)勵(lì)機(jī)制,結(jié)合“雙評(píng)價(jià)器”架構(gòu),有效提升了機(jī)器人的地形感知與適應(yīng)能力。
為了實(shí)現(xiàn)真實(shí)世界的部署,該框架還搭載了基于激光雷達(dá)的高程地圖系統(tǒng),結(jié)合模擬訓(xùn)練中的域隨機(jī)化技術(shù),使機(jī)器人能夠?qū)崟r(shí)感知并適應(yīng)復(fù)雜地形。在這一框架下,G1展現(xiàn)出了驚人的零樣本泛化能力,即便在未經(jīng)訓(xùn)練的稀疏地形上,也能以高達(dá)80%的成功率穩(wěn)健行走。
不僅如此,G1的算法升級(jí)還帶來(lái)了舞蹈能力的飛躍。在近期流出的視頻中,G1展現(xiàn)了流暢的舞姿,與機(jī)器人狗同行、逛街等場(chǎng)景更是引人遐想。宇樹科技表示,G1已具備學(xué)習(xí)任意舞蹈的能力,邀請(qǐng)公眾共同探索更多可能。
宇樹科技的CEO王興興對(duì)機(jī)器人技術(shù)的未來(lái)發(fā)展充滿信心,他預(yù)測(cè)到2025年底,AI人形機(jī)器人將迎來(lái)新的發(fā)展階段。盡管家用機(jī)器人的普及可能因安全性要求更高而稍慢,但基礎(chǔ)服務(wù)業(yè)或工業(yè)應(yīng)用已指日可待。目前,宇樹科技的H1和G1人形機(jī)器人雖已從京東平臺(tái)下架,但據(jù)稱是由于庫(kù)存不足,而非市場(chǎng)需求減弱。隨著技術(shù)的不斷成熟與成本的逐步降低,人形機(jī)器人走進(jìn)千家萬(wàn)戶的夢(mèng)想正逐步變?yōu)楝F(xiàn)實(shí)。