滾動資訊

當前位置：網(wǎng)界 > 科技人物 > 正文內(nèi)容

智元啟元大模型GO-1發(fā)布：具身智能新紀元，機器人通用能力大飛躍！

時間：2025-03-10 16:09 作者：陸辰風

智元機器人在科技創(chuàng)新領域邁出了重要一步，正式揭曉了其首個通用具身基座大模型——智元啟元大模型（簡稱GO-1）。這一發(fā)布標志著具身智能技術(shù)取得了突破性進展。

GO-1大模型的核心在于其創(chuàng)新的Vision-Language-Latent-Action（ViLLA）架構(gòu)，該架構(gòu)由多模態(tài)大模型（VLM）與混合專家模型（MoE）兩大組件構(gòu)成。VLM通過海量互聯(lián)網(wǎng)圖文數(shù)據(jù)的訓練，獲得了卓越的場景感知和語言理解能力。而MoE則進一步細分為隱式規(guī)劃器（Latent Planner）和動作專家（Action Expert），前者通過大規(guī)?？绫倔w和人類操作數(shù)據(jù)，實現(xiàn)了對動作的深刻理解；后者則憑借百萬真機數(shù)據(jù)的訓練，具備了精細的動作執(zhí)行能力。這三者之間的緊密協(xié)作，不僅使GO-1大模型能夠?qū)W習人類視頻，還實現(xiàn)了小樣本快速泛化，極大地降低了具身智能的應用門檻。

GO-1大模型的問世，意味著具身智能的全面革新。它能夠結(jié)合人類和多種機器人數(shù)據(jù)，使機器人具備革命性的學習能力，可廣泛應用于各類環(huán)境和物品中，迅速適應新任務，學習新技能。同時，GO-1大模型支持部署到不同形態(tài)的機器人本體，實現(xiàn)高效落地，并在實際應用中持續(xù)進化。

GO-1大模型的四大特點尤為突出：首先，它能夠結(jié)合互聯(lián)網(wǎng)視頻和真實人類示范進行學習，從而更好地理解人類行為，提升服務質(zhì)量。其次，GO-1大模型具備強大的小樣本快速泛化能力，能夠在極少數(shù)據(jù)甚至零樣本的情況下，迅速適應新場景和新任務，顯著降低了使用門檻和后訓練成本。再者，GO-1大模型作為通用機器人策略模型，能夠在不同機器人形態(tài)之間遷移，實現(xiàn)快速適配和群體升智。最后，得益于智元的數(shù)據(jù)回流系統(tǒng)，GO-1大模型能夠在實際執(zhí)行中遇到問題時持續(xù)學習進化，變得越來越智能。

GO-1大模型的構(gòu)建基于具身領域的數(shù)字金字塔模型，該模型吸納了人類世界多種維度和類型的數(shù)據(jù)。數(shù)字金字塔的底層是互聯(lián)網(wǎng)的大規(guī)模純文本與圖文數(shù)據(jù)，為機器人提供通用知識和場景理解的基礎。往上是大規(guī)模人類操作/跨本體視頻數(shù)據(jù)，幫助機器人學習動作操作模式。再往上則是用于增強泛化性的仿真數(shù)據(jù)，使機器人能夠適應不同場景和物體。而金字塔的頂層，則是高質(zhì)量的真機示教數(shù)據(jù)，用于訓練精準動作執(zhí)行。

相較于現(xiàn)有的Vision-Language-Action（VLA）架構(gòu)，ViLLA架構(gòu)通過預測隱式動作標記，有效彌合了圖像-文本輸入與機器人執(zhí)行動作之間的鴻溝。它能夠充分利用高質(zhì)量的AgiBot World數(shù)據(jù)集以及互聯(lián)網(wǎng)大規(guī)模異構(gòu)視頻數(shù)據(jù)，顯著增強策略的泛化能力。基于ViLLA架構(gòu)，GO-1大模型能夠接收多相機的視覺信號、力覺信號、語言指令等多模態(tài)信息，直接輸出機器人的動作執(zhí)行序列。

GO-1大模型為機器人提供了全面的“基礎教育”和“職業(yè)教育”，使機器人天生就能適應新場景，輕松面對多樣化的環(huán)境和物體，快速學習新的操作。例如，當用戶給出“掛衣服”的指令時，GO-1大模型能夠根據(jù)看到的畫面理解任務要求，設想操作步驟，并最終執(zhí)行完成整個任務。

在更深層次的技術(shù)層面，GO-1大模型在構(gòu)建和訓練階段學習了互聯(lián)網(wǎng)的大規(guī)模純文本和圖文數(shù)據(jù)，使其能夠理解“掛衣服”在此情此景下的具體含義和要求。同時，通過學習人類操作視頻和其他機器人的操作視頻，GO-1大模型能夠知道掛衣服通常包括哪些環(huán)節(jié)。通過仿真不同衣服、衣柜和房間，以及模擬掛衣服的操作，GO-1大模型能夠理解環(huán)節(jié)中對應的物體和環(huán)境，并打通整個任務過程。最后，由于學習了真機的示教數(shù)據(jù)，機器人能夠精準完成整個任務的操作。

GO-1大模型的推出，標志著具身智能正朝著通用化、開放化、智能化的方向快速邁進。機器人將能夠在不同場景中執(zhí)行多種任務，而無需針對每個新任務重新訓練。同時，機器人將不再局限于實驗室環(huán)境，而是能夠適應多變的真實世界。機器人將能夠理解自然語言指令，并根據(jù)語義進行組合推理，而不再局限于預設程序。

更多>同類內(nèi)容

蘋果Apple One高級訂閱海外升級，新增“邀請”與“美食”兩大特權(quán)

蘋果公司近期對海外的Apple One高級訂閱服務進行了升級，新增了兩項引人注目的福利。此次更新，訂閱用戶將能夠在全新的“邀請”應用中享受“創(chuàng)建邀請”功能，并可通過蘋果“新聞”應用探索“Apple News+ Food”這一美食專題頻道。Apple One高級訂閱服務目前在美國地區(qū)的

03-11

Bose Flex藍牙音箱二代“花瓣粉”上市，顏值與性能并存！

03-11

CoreWeave與OpenAI達成119億美元交易，共筑AI基礎設施新篇章

03-11

ViVeTool 0.3.4版更新：Win11 24H2用戶必備，功能優(yōu)化問題修復

03-11

銘凡AI X1迷你主機亮相：搭載AMD銳龍7 260，性能強勁還支持OCuLink

03-11

宏碁掠奪者系列新本曝光：RTX 5060顯卡配8GB GDDR7顯存，售價約1.6萬

03-11

iOS 18.4強制升級HomeKit，舊智能家居設備怎么辦？

03-11

我國磁等離子體發(fā)動機突破百千瓦大關，航天動力技術(shù)邁上新臺階！

03-11

iPhone 17 Air機模搶先看！蘋果史上最薄手機設計驚艷嗎？

03-11

小米SU7 Ultra賽道事故頻發(fā)，小米汽車官方：安全駕駛，切勿兒戲！

03-11

iPhone 17系列大改款：Air機型登場，三種新外觀你最愛哪款？

03-11

美的集團“反內(nèi)卷”新招：18點20強制下班，能否引領職場新風尚？

03-11

蘋果Vision Pro迎來visionOS 2.4 Beta 3更新，你收到了嗎？

03-11

零跑B10預售火爆，1小時訂單破萬，激光雷達智駕版成亮點！

03-10

谷歌Pixel 4a電池更新真相：為防過熱，澳監(jiān)管機構(gòu)發(fā)布召回通知

03-10

點擊查看更多 +

全站最新

蘋果Apple One高級訂閱海外升級，新增“邀請”與“美食”兩大特權(quán)

微信安卓8.0.57測試版來襲！主要優(yōu)化哪些已知問題？

小米人形機器人CyberOne量產(chǎn)計劃是謠言？官方這樣說

微信朋友圈大升級：5分鐘長視頻隨心分享！

GDC2025：EA揭秘死亡空間與鋼鐵俠游戲紋理創(chuàng)新技術(shù)

企業(yè)應對職場“內(nèi)卷”：強制下班，以人為本的新策略？

熱門內(nèi)容

本欄最新

蘋果Apple One高級訂閱海外升級，新增“邀請”與“美食”兩大特權(quán)

Bose Flex藍牙音箱二代“花瓣粉”上市，顏值與性能并存！

ViVeTool 0.3.4版更新：Win11 24H2用戶必備，功能優(yōu)化問題修復

銘凡AI X1迷你主機亮相：搭載AMD銳龍7 260，性能強勁還支持OCuLink

宏碁掠奪者系列新本曝光：RTX 5060顯卡配8GB GDDR7顯存，售價約1.6萬

iOS 18.4強制升級HomeKit，舊智能家居設備怎么辦？

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標，是該商標的唯一持有者，未經(jīng)授本公司授權(quán)，嚴禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

智元啟元大模型GO-1發(fā)布：具身智能新紀元，機器人通用能力大飛躍！

智元啟元大模型GO-1發(fā)布：具身智能新紀元，機器人通用能力大飛躍！