理想汽車近期在其“理想AI Talk 第二季”主題活動(dòng)中,隆重推出了VLA司機(jī)大模型,該活動(dòng)以“從動(dòng)物進(jìn)化到人類”為核心理念,吸引了廣泛關(guān)注?;顒?dòng)中,理想汽車董事長(zhǎng)兼CEO李想發(fā)表了深度演講,不僅分享了他對(duì)人工智能未來趨勢(shì)的獨(dú)到見解,還詳細(xì)闡述了VLA司機(jī)大模型的功能價(jià)值、訓(xùn)練體系及研發(fā)挑戰(zhàn)。
李想將AI工具的發(fā)展劃分為三個(gè)階段:信息工具、輔助工具和生產(chǎn)工具。他指出,當(dāng)前大多數(shù)AI應(yīng)用僅停留在信息工具階段,提供的信息往往冗余且價(jià)值有限。輔助工具階段,AI能夠提升效率,但仍需人類介入。而未來,當(dāng)AI進(jìn)化為生產(chǎn)工具時(shí),將能夠獨(dú)立承擔(dān)專業(yè)任務(wù),大幅提升效率與質(zhì)量。判斷智能體是否真正智能,關(guān)鍵就在于其能否成為生產(chǎn)工具。
為了推動(dòng)AI向生產(chǎn)工具邁進(jìn),理想汽車自2024年起便著手研究VLA。李想透露,VLA的發(fā)展目標(biāo)是擁有與人類智慧相當(dāng)?shù)哪芰?。它不僅能像人眼一樣通過3D和2D視覺清晰感知周圍路況,還能像人腦一樣理解所見,通過語言交流做出決策,并精準(zhǔn)執(zhí)行駕駛操作,實(shí)現(xiàn)與人類駕駛相當(dāng)?shù)撵`活性和可靠性。
VLA的訓(xùn)練過程分為三步。首先,它需要學(xué)習(xí)交通規(guī)則和世界知識(shí),通過大量高清圖像和文字資料優(yōu)化模型,使其能在汽車上快速運(yùn)行。其次,在基礎(chǔ)模型上加入動(dòng)作數(shù)據(jù),使VLA能夠預(yù)判其他車輛行駛軌跡和環(huán)境變化,靈活應(yīng)對(duì)復(fù)雜交通狀況。最后,通過收集人類反饋,在模擬環(huán)境中反復(fù)練習(xí),讓VLA學(xué)會(huì)平穩(wěn)駕駛,遵守交通規(guī)則,適應(yīng)國(guó)內(nèi)駕駛習(xí)慣。
除了功能強(qiáng)大,VLA還面臨著安全性和模型黑盒兩大挑戰(zhàn)。為了確保安全性,理想汽車組建了專業(yè)團(tuán)隊(duì),對(duì)VLA進(jìn)行“職業(yè)素養(yǎng)”培訓(xùn),教它遵守交通規(guī)則,養(yǎng)成良好駕駛習(xí)慣。針對(duì)模型黑盒問題,理想汽車通過重建和生成技術(shù),構(gòu)建了一個(gè)與現(xiàn)實(shí)交通情況一致的虛擬世界,使VLA能夠在其中低成本、準(zhǔn)確地模擬各種路況,提前驗(yàn)證解決方案,從而解決決策過程不透明的問題。
在人工智能時(shí)代,理想汽車堅(jiān)持扎實(shí)的基本功積累,通過系統(tǒng)化推進(jìn)研究、研發(fā)和業(yè)務(wù)落地,實(shí)現(xiàn)技術(shù)發(fā)展。面對(duì)輔助駕駛技術(shù)瓶頸,理想汽車依靠自研團(tuán)隊(duì)優(yōu)化芯片與模型適配,自研底層推理引擎解決運(yùn)行難題。同時(shí),理想汽車還堅(jiān)持超預(yù)期投入自研基座模型,并開源自研的汽車操作系統(tǒng),為行業(yè)發(fā)展貢獻(xiàn)力量。
李想在演講中還分享了他的創(chuàng)業(yè)方法論和個(gè)人成長(zhǎng)路徑,強(qiáng)調(diào)直面問題、解決痛點(diǎn)、持續(xù)學(xué)習(xí)的重要性。他回顧了理想汽車的創(chuàng)業(yè)歷程,表示盡管挑戰(zhàn)不斷升級(jí),但團(tuán)隊(duì)協(xié)作讓他無悔過往。面對(duì)AI的快速發(fā)展,李想呼吁保留人性特質(zhì),守護(hù)人類生命力。理想汽車將繼續(xù)在輔助駕駛新賽道上挑戰(zhàn)極限,為行業(yè)和用戶創(chuàng)造價(jià)值。