- 自動駕駛BEV感知算法指南
- 易顯維 虞凡
- 728字
- 2025-02-10 16:18:51
1.3.1 基于單應性的方法
單應性是指兩個平面之間的映射關系,它刻畫了某平面上的點如何通過特定變換映射至另一平面,單應矩陣常用來表達兩張圖像共同平面上的點的變換關系。將透視視角(PV)轉換為鳥瞰視角(BEV)的傳統方法是利用兩個視角圖像(以下簡稱為視圖)之間固有的幾何投影關系,其核心是利用地面上的物理映射關系來橋接兩個視圖。這個轉換過程通常會用到逆透視映射(Inverse Perspective Mapping,IPM)方法。
BEV感知算法中的IPM方法是一種將車載攝像頭捕獲的圖像從透視視角轉換為鳥瞰視角的技術。這種方法通過幾何變換,能夠對圖像中道路和車輛等物體的畸變進行校正,生成更準確的車輛行駛環境二維平面圖,為自動駕駛和智能車輛導航提供重要支持。
IPM方法引入了附加約束條件,即逆映射點嚴格位于水平面上,這是實現從透視視角圖像到鳥瞰視角圖像轉換的基礎。轉換首先通過相機旋轉的單應性進行預處理或后處理,然后進行各向異性縮放。單應性矩陣可以從相機的內外參數中導出。
然而,傳統的IPM方法在很大程度上依賴于地面是一個平面的假設,這可能導致在檢測位于地平面上方的物體時出現問題。為了解決這一問題,一些方法開始融入更多的語義信息以減少失真。例如,某些方法利用語義信息將透視圖中的物體足跡轉換為BEV中的對應表示,從而遵循了單應性隱含的“地面是一個平面”的假設。由于透視視圖和鳥瞰視圖之間存在明顯的差異和變形,因此單純依賴IPM方法往往無法生成完全無失真的BEV圖像或語義圖,因此引入生成對抗網絡(GAN)方法用于提高生成的BEV特征或圖像的真實性。GAN方法能夠有效地減輕圖像的失真現象,并增強3D檢測的準確性。
綜上所述,基于單應性的方法依賴于透視視角與鳥瞰視角之間的地面物理映射關系,通過簡單的矩陣乘法可以實現圖像轉換,同時結合語義信息和GAN技術能夠提高轉換質量。