在理想汽車的最新活動中,AItalk系列迎來了第二集,李想在這一集中深入探討了VLA(視覺語言行動模型)的概念。
李想提到,VLA在機器人領域同樣備受關(guān)注,但對于理想汽車而言,它有著獨特的定義。理想汽車將VLA視為一個“司機大模型”,一個能夠像人類司機一樣執(zhí)行任務的智能系統(tǒng)。
李想強調(diào),VLA的實現(xiàn)并非一蹴而就,而是一個逐步進化的過程。他分享了VLA發(fā)展的第一個階段,即從2021年開始,理想汽車利用機器學習技術(shù)進行感知,并結(jié)合后續(xù)的規(guī)則算法,包括規(guī)劃、控制、執(zhí)行等模塊,這些模塊分段式地協(xié)同工作。
為了更形象地說明這一點,李想打了一個比方,將這一階段的智能比作昆蟲動物的智能。他指出,這種智能依賴于既定的規(guī)則和高精地圖,就像螞蟻通過特定的路徑和任務分配來完成工作一樣。
李想進一步解釋,雖然這一階段的智能還相對基礎,但它為VLA的未來發(fā)展奠定了堅實的基礎。隨著技術(shù)的不斷進步和算法的持續(xù)優(yōu)化,理想汽車期待VLA能夠逐漸進化到更高層次的智能,最終實現(xiàn)像人類司機一樣靈活、高效地執(zhí)行任務。