ECCV,即歐洲計算機視覺國際會議,是計算機視覺領域中最頂級的會議之一,與ICCV和CVPR并稱為計算機視覺領域的“三大頂會”。ECCV每兩年舉行一次,其專業(yè)性、權威性和高含金量廣受認可。據(jù)官方透露,ECCV2024共接收論文8585篇,創(chuàng)下歷史新高,最終錄用論文2395篇,接收率為27.9%。
中科慧拓入選的2篇論文研究成果分別為《DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation》,《Generative End-to-End Autonomous Driving》。
Generative End-to-End Autonomous Driving
中科慧拓提出了GenAD,這是第一個將自動駕駛轉化為生成建模問題的生成框架,在以視覺為中心的端到端自動駕駛方面實現(xiàn)了最先進的性能,并且效率很高。
該技術顛覆了UniAD的漸進式流程端到端方案,探討了一種新的端到端自動駕駛范式,關鍵在于采用生成式人工智能的方式預測自車和周圍環(huán)境在過去場景中的時序演變方式。
技術上本方案提出以實例中心的場景表示,首先將周圍場景轉換為地圖和感知實例。然后,使用變分自編碼器在結構潛在空間中學習未來軌跡分布,用于軌跡先驗建模。進一步采用時序模型來捕捉潛在空間中的代理和自車運動,以生成更有效的未來軌跡。最終,GenAD通過在學習的結構潛在高斯空間分布中采樣,并使用學習的時序模型生成未來信息,同時執(zhí)行運動預測和規(guī)劃。該模型在城市場景數(shù)據(jù)集Nuscenes已經取得了SOTA的性能,并在實時性能上遠超UniAD。
DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation
中科慧拓提出了DiffusionDepth,一種新的單目深度估計方法,將單目深度估計任務重新建模為去噪擴散過程。該模型通過單目RGB圖像的特征為條件引導,迭代地將隨機深度分布精細化為詳細的深度圖,克服了生成模型應用于稀疏真值深度場景的局限性。實驗結果表明,在KITTI和NYU-Depth-V2數(shù)據(jù)集上,DiffusionDepth達到了最新的性能。
本次入選ECCV的兩篇論文,充分展示了中科慧拓在自動駕駛視覺感知技術領域的強大研發(fā)能力。這一成就不僅證明了公司在該領域的領先地位,還彰顯了公司科研成果的國際影響力。展望未來,中科慧拓將繼續(xù)踐行“長期主義”戰(zhàn)略,平衡技術突破與商業(yè)化推進。公司將持續(xù)專注于核心技術的深耕與創(chuàng)新,并大力推動量產項目的落地實施,為自動駕駛行業(yè)的發(fā)展貢獻力量。
往期推薦
客戶之聲|哈爾烏素露天煤礦無人駕駛編組數(shù)量增至4個!
了解慧拓文化
關注愚公博士
閱讀原文
進入官方知乎
點擊“在看
資訊不錯過
聲明:本文系轉載自互聯(lián)網,請讀者僅作參考,并自行核實相關內容。若對該稿件內容有任何疑問或質疑,請立即與鐵甲網聯(lián)系,本網將迅速給您回應并做處理,再次感謝您的閱讀與關注。
不想錯過新鮮資訊?
微信"掃一掃"