近日,我校自動化學院、人工智能學院物聯網智能機器人團隊范保杰教授、徐豐羽教授與碩士生李嘯天同學的研究成果 GAFusion: Adaptive Fusing LiDAR and Camera with Multiple Guidance for 3D Object Detection(《面向三維目標檢測的相機與激光雷達全局自適應融合方法》)被國際計算機視覺與模式識別會議CVPR2024錄用。近年來,該團隊已在計算機視覺頂級會議CVPR、ECCV,機器人頂級會議ICRA、IROS發表高水平論文10余篇。
該論文聚焦于多模態3D目標檢測,特別是在鳥瞰圖(BEV)視角下的應用。研究團隊提出了一種名為GAFusion創新方法,通過稀疏深度引導(SDG)和激光雷達占據引導(LOG)生成具有豐富深度信息的3D特征,利用激光雷達引導的自適應融合transformer(LGAFT)從全局角度增強不同模態BEV特征之間的交互。此外,他們還設計了一個BEV網格來存放多尺度下采樣特征,并開發了多尺度雙路徑transformer(MSDPT),以擴大不同模態特征的接受域,顯著提高了檢測性能。GAFusion有助于自動駕駛領域安全性的重大提升,也為多模態3D目標檢測領域后續的研究提供更多的見解。該研究成果同時得到了國家自然基金重點項目課題、國家自然基金面上項目等的支持。
GAFusion算法的整體框架圖
Nuscenes 數據集與BEVFusion對多類目標三維檢測結果可視化比較
CVPR(全稱IEEE/CVF Conference on Computer Vision and Pattern Recognition)是人工智能與計算機視覺領域最頂級的國際學術會議(CCF A類會議)。據谷歌學術指標最新統計,CVPR位列總榜第4,前三名分別為Nature、NEJM和Science,在計算機學科排名第1。
(撰稿:范保杰 初審:徐豐羽 編輯:王存宏 審核:張豐)