理想汽車近期在自動駕駛技術(shù)領(lǐng)域取得了重大突破,正式推出了其新一代技術(shù)——MindVLA大模型。這一創(chuàng)新成果在NVIDIA GTC 2025大會上首次亮相,隨即引起了廣泛關(guān)注。
據(jù)理想汽車介紹,MindVLA大模型集成了視覺、語言和行為三大智能,為機器人大模型樹立了新的標(biāo)桿。簡而言之,MindVLA不僅能夠“看到”和“聽到”,更重要的是它能夠“做到”,實現(xiàn)了感知與行動的完美結(jié)合。
這一技術(shù)的推出,對于用戶和整個汽車行業(yè)都具有深遠(yuǎn)的意義。對于用戶而言,未來的汽車將不再僅僅是交通工具,而是能夠聽懂指令、理解需求、提供幫助的“智能伙伴”。而對于汽車行業(yè),MindVLA的出現(xiàn)或?qū)⒁l(fā)一場出行方式的革命,正如當(dāng)年的iPhone 4重新定義了智能手機一樣。
理想汽車還透露,MindVLA大模型預(yù)計將于今年7月與理想i8車型同時首發(fā)。屆時,配備AD Max系統(tǒng)的車輛將能夠享受到這一先進(jìn)技術(shù)帶來的便捷與智能。
針對網(wǎng)友關(guān)心的其他問題,理想汽車也一一進(jìn)行了解答。對于現(xiàn)款車型是否支持MindVLA大模型的問題,理想汽車表示,目前能夠運行端到端+VLM大模型的車輛,后續(xù)也將支持更加強大的MindVLA大模型。
那么,MindVLA大模型與現(xiàn)有的端到端+VLM大模型有何不同呢?從技術(shù)層面來看,MindVLA將空間智能、語言智能和行為智能統(tǒng)一在一個模型內(nèi),使自動駕駛系統(tǒng)能夠感知環(huán)境、思考并作出適應(yīng)。而在能力表現(xiàn)上,MindVLA加持下的汽車更像是一個智能助手,能夠與用戶溝通、理解用戶意圖,并執(zhí)行各種任務(wù)。
例如,在陌生車庫中,MindVLA能夠自主尋找車位并完成泊車;它還能根據(jù)駕駛員的語音指令調(diào)整行駛速度或轉(zhuǎn)向;甚至在你發(fā)送給它地標(biāo)照片后,它也能按圖索驥找到目的地。可以說,有了MindVLA的汽車,就像有了一個能聽懂語音指令、看得見陌生地標(biāo)、并能在陌生環(huán)境中自主導(dǎo)航的專職司機。
針對網(wǎng)友關(guān)心的端到端和VLM更新速度問題,理想汽車表示,這兩個模型將保持高速迭代,并持續(xù)推進(jìn)端到端+VLM的持續(xù)提升。
MindVLA大模型與理想汽車之前推出的MindGPT也存在一定的聯(lián)系。MindVLA作為下一代自動駕駛核心架構(gòu),使用了MindGPT作為語言基座。這一設(shè)計繼承了MindGPT在語言理解與交互領(lǐng)域的優(yōu)勢能力,并針對自動駕駛場景進(jìn)行了專項優(yōu)化。這也體現(xiàn)了智艙與智駕在功能層的協(xié)同創(chuàng)新。
對于MindVLA千人團/萬人團何時內(nèi)測的問題,理想汽車表示,具體內(nèi)測時間將以官方公布為準(zhǔn)??梢灶A(yù)見的是,隨著MindVLA大模型的逐步推廣和應(yīng)用,未來的智能出行將更加便捷、安全和舒適。