據(jù)外媒報道,中國浙江大學(xué)(Zhejiang University)、北京大學(xué)(Peking University,)與浙江綠色智行科創(chuàng)有限公司(Zhejiang Green Zhixing Technology co., ltd)的研究人員合作研發(fā)了一款突破性模型ScoreLiDAR,可將3D場景的構(gòu)建完成速度提高5倍,為實時自動駕駛車輛感知技術(shù)的發(fā)展鋪平了道路。

場景重建(圖片來源:浙江大學(xué))
背景
利用車載傳感器進行高效且精確的環(huán)境識別,對于確保自動駕駛汽車的安全運行至關(guān)重要。在眾多傳感器中,3D激光雷達(LiDAR)因高精度和廣泛的探測范圍而成為一款不可或缺的組件。不過,激光雷達生成的3D點云往往比較稀疏,特別是在有遮擋或復(fù)雜駕駛場景下,這對于場景理解造成了挑戰(zhàn)。因此,需要對激光雷達場景進行補全,即通過稀疏的輸入信息重建出密集的3D場景,從而實現(xiàn)更好的感知。
傳統(tǒng)的激光雷達場景補全方法包括基于深度補全和基于有符號距離場(SDF)的技術(shù)。此類方法有一定效果,但是通常存在細節(jié)丟失或受制于體素分辨率等的不足。最近,擴散模型被引入到激光雷達補全領(lǐng)域,并顯示出強大的訓(xùn)練穩(wěn)定性及高質(zhì)量的生成結(jié)果。例如,LiDiff和擴散語義場景補全(DiffSSC)技術(shù)通過改進噪聲調(diào)度和融合語義任務(wù),顯著提升了生成場景的豐富度。不過,此類模型的采樣過程緩慢,限制了其應(yīng)用于實時應(yīng)用,而此類實時應(yīng)用對于自動駕駛汽車而言至關(guān)重要。
為了解決上述問題,研究人員們推出了新型蒸餾框架ScoreLiDAR,專為基于擴散模型的激光雷達場景補全而設(shè)計。ScoreLiDAR通過將蒸餾框架引入訓(xùn)練過程,用一個預(yù)訓(xùn)練的教師擴散模型訓(xùn)練一個精簡的學(xué)生模型,以及結(jié)合結(jié)構(gòu)損失提升幾何精度,極大地加快了場景補全的速度,同時保持了卓越的場景質(zhì)量,而且通過廣泛的實驗得到了驗證。