蓋世汽車訊 據外媒報道,印度海得拉巴國際信息技術學院(IIIT Hyderabad)研發(fā)出一款電動自動駕駛汽車,能夠在兩點之間的路線上自動導航,且配備先進的避碰機制。此外,該車還配備了最新技術,包括3D激光雷達(LIDAR)、深度攝像頭、GPS以及一個航姿參照系統(tǒng)(Attitude and Heading Reference System,AHRS),能夠解讀并執(zhí)行開放式的自然語言命令,從而抵達指定目的地。


電動自動駕駛汽車(圖片來源:印度海得拉巴國際信息技術學院)
該車輛運用了基于SLAM(即時定位與地圖構建)技術的點云地圖測繪方法,旨在構建詳盡的校園環(huán)境地圖。通過LIDAR技術引導,車輛能夠獲得實時的狀態(tài)估計信息,為駕駛過程中的精確定位提供有力支持。此外,車輛還采用了基于模型預測控制(Model Predictive Control)的路徑優(yōu)化技術,確保能夠實時生成最優(yōu)的行進路線。通過數據驅動模型的應用,可以對這些行進路線進行初始化處理,進而優(yōu)化推理時間。
人類導航通常需要依賴情境線索和地標的口頭指示,例如“在白色建筑物處右轉”或“在入口附近停車”。同理,自動駕駛系統(tǒng)也需要精準的定位信息,一般也采用高分辨率的GPS或高精地圖來實現。不過,此類方法的計算量通常很大。
OpenStreetMaps(OSM)等開源拓補地圖有時可用作地理定位技術的替代方案。雖然此類地圖比較輕便,但是定位精度卻僅能達到6至8米,而且可能還會確實動態(tài)特征信息,例如,開放的停車場。IIIT Hyderabad則致力于研究運用現實世界地標的方法,旨在模擬與人類類似的導航流程。
該學院采用基礎模型,將對世界普遍語義的理解整合進導航任務。通過在開源拓補地圖中添加基于語言的地標信息,例如“一條長椅”或“一個足球場”等,該系統(tǒng)能夠靈活地識別此類其未經訓練的地點。該方法讓該系統(tǒng)能夠對不熟悉的環(huán)境有一般性認知。此外,該學院的機器人研究中心(Robotics Research Centre)將成熟方法與較新的技術相結合,以解決定位和導航方面的挑戰(zhàn),并采用內部研發(fā)的原型進行展示。
自動駕駛導航系統(tǒng)涵蓋地圖測繪、定位及規(guī)劃功能。傳統(tǒng)系統(tǒng)采用模塊化管道或端到端架構,并且越來越多地將語言處理技術集成進來,以增強可解釋性。此類系統(tǒng)能夠依據自然語言導航指示(例如向右轉并在食品攤附近停車)來進行導航,其核心在于實現無碰撞的路徑規(guī)劃。然而,傳統(tǒng)系統(tǒng)通常會將目標預測、感知與規(guī)劃分開來,有可能會引發(fā)結果不一致以及對感知模型的依賴。
為了解決上述問題,IIIT Hyderabad采用端到端訓練法,讓預測結果與規(guī)劃目標保持一致。此外,還研發(fā)了一個輕量化的視覺語言模型,以將視覺場景的理解與自然語言命令結合。該模型依據車輛的視角視圖和編碼指令,以預測目標的位置。
在確保預測結果與真實世界的約束相符的過程中,可能會出現諸多挑戰(zhàn)。例如,“停在紅色車后面”等指令可能表示不可駕駛區(qū)域。為此,IIIT Hyderabad將一個感知模塊與一個定制規(guī)劃器整合在一起,其中規(guī)劃器配備了一個神經網絡框架,其可微分特質使其能夠開展分階段訓練,從而提升預測精度及規(guī)劃結果。此種方法讓系統(tǒng)內的所有組件協同工作,以便在現實世界條件下實現更優(yōu)的性能。