埃隆·馬斯克在得克薩斯超級(jí)工廠的最新采訪中,再次將聚光燈投向了特斯拉的Optimus人形機(jī)器人,稱其為公司未來發(fā)展的核心驅(qū)動(dòng)力之一。他親自演示了這款機(jī)器人在日常生活中的多種應(yīng)用場(chǎng)景,包括打掃房間、操作清潔工具、處理家務(wù)細(xì)節(jié)如撕紙巾、烹飪輔助、開關(guān)柜門以及窗簾操控,甚至展示了其強(qiáng)大的物理能力——輕松提起Model X的前連桿并放入手推車。
尤為引人注目的是,Optimus所展現(xiàn)的所有這些復(fù)雜功能,都是由一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)所驅(qū)動(dòng)的。特斯拉的研發(fā)團(tuán)隊(duì)采用了一種創(chuàng)新的學(xué)習(xí)方法,即向機(jī)器人輸入大量人類執(zhí)行日常任務(wù)的第一視角視頻數(shù)據(jù)。這種技術(shù)使得Optimus能夠直接觀察、學(xué)習(xí)并模仿人類動(dòng)作,極大地加速了其新技能的掌握和性能優(yōu)化。
特斯拉Optimus項(xiàng)目的領(lǐng)航者M(jìn)ilan Kovac,在社交媒體上分享了項(xiàng)目的最新進(jìn)展和未來規(guī)劃。他透露,團(tuán)隊(duì)正積極探索讓機(jī)器人從更廣泛的視頻資源中學(xué)習(xí)人類行為的可能性,不再局限于第一人稱視角的視頻,而是擴(kuò)展到包括第三人稱視角在內(nèi)的多種攝像設(shè)備拍攝的內(nèi)容。
Kovac強(qiáng)調(diào):“我們已經(jīng)在將人類視頻知識(shí)轉(zhuǎn)化為機(jī)器人可執(zhí)行動(dòng)作方面取得了顯著成果,盡管目前主要集中在第一人稱視頻上。這一突破讓我們能夠更迅速地在新任務(wù)中部署機(jī)器人,相較于傳統(tǒng)的人工遠(yuǎn)程操作,效率有了質(zhì)的飛躍?!?/p>
他還進(jìn)一步闡述,借助這一創(chuàng)新方法,Optimus正不斷解鎖新的能力。這些能力可以通過簡(jiǎn)單的語音或文字指令激活,并由機(jī)器人的核心神經(jīng)網(wǎng)絡(luò)統(tǒng)一調(diào)度執(zhí)行。展望未來,Kovac的團(tuán)隊(duì)計(jì)劃進(jìn)一步深化這一技術(shù),將學(xué)習(xí)范圍擴(kuò)展到基于第三人稱視角的視頻,利用互聯(lián)網(wǎng)上豐富的視頻資源,同時(shí)探索在真實(shí)或模擬環(huán)境中引入自我強(qiáng)化學(xué)習(xí)機(jī)制,以增強(qiáng)機(jī)器人的穩(wěn)定性和環(huán)境適應(yīng)能力。