官术网_书友最值得收藏!

1.3.3 基于多層感知器的方法

基于多層感知器(MultiLayer Perception,MLP)的方法利用多層感知器作為復雜的映射函數,將輸入映射到不同模態、維度或表示的輸出上,以實現從透視視角到BEV視角的轉換。

為了消除相機校準設置中的繼承感應偏差,一些方法采用MLP來學習相機校準的隱式表示。例如,視圖解析網絡(View Parsing Network,VPN)選擇了兩層MLP,利用全局感受野的需求,通過“關注-映射-重塑”的過程將每個PV特征圖轉換為BEV特征圖,然后添加來自不同相機的所有特征圖以進行多視圖融合。金字塔占用網絡(Pyramid Occupancy Networks,PON)則是基于網絡對于將特征映射到BEV的大量垂直上下文的需求,利用特征金字塔提取多個分辨率的圖像特征,使用MLP沿高度軸折疊圖像特征并沿深度軸擴展來執行視圖變換,如圖1-9所示。

圖1-9 PON按列將透視圖特征轉換為鳥瞰視圖特征

基于MLP的方法利用多層感知器作為映射函數,實現了視角間的轉換,為自動駕駛等應用提供了重要的感知能力。

主站蜘蛛池模板: 河池市| 漠河县| 永宁县| 沈阳市| 财经| 济南市| 永城市| 工布江达县| 永修县| 夏邑县| 巩义市| 阿尔山市| 邯郸市| 陕西省| 密山市| 锦屏县| 沂源县| 康马县| 于都县| 北票市| 玛多县| 延寿县| 柳江县| 视频| 泰州市| 马尔康县| 达州市| 太仓市| 资源县| 广安市| 乐都县| 寻甸| 阿坝| 冀州市| 金华市| 栾川县| 永修县| 吉林省| 长子县| 西畴县| 宜川县|