官术网_书友最值得收藏!

2.1.3 系統(tǒng)架構(gòu)

智能駕駛車輛的物理架構(gòu)大體上由環(huán)境傳感器平臺、計算平臺和智能底盤三個部分組成。

2.1.3.1 環(huán)境傳感器平臺

環(huán)境傳感器是智能駕駛系統(tǒng)的“眼睛”,其主要任務(wù)是對智能駕駛車輛周圍環(huán)境,例如其他車輛位置、車道線、交通信號和行人等進行感知,并將相關(guān)數(shù)據(jù)傳輸給計算平臺,使智能駕駛系統(tǒng)能有效對周邊環(huán)境進行實時感知。環(huán)境傳感器主要包括毫米波雷達、激光雷達和相機等,以及導(dǎo)航定位和慣性導(dǎo)航傳感器等。環(huán)境傳感器的具體參數(shù)和比較將在本章后文中進行詳細介紹。

2.1.3.2 計算平臺

計算平臺的主控制芯片是無人駕駛系統(tǒng)的“大腦”,是信息處理中心和決策制定者。計算平臺本質(zhì)上是一臺移動的超級計算機,為豐富的智能化應(yīng)用功能提供了強大的算力支撐和軟件運行環(huán)境。其組成部分包括基于車載人工智能計算芯片的車載計算平臺硬件和車載操作系統(tǒng),可實現(xiàn)多種類型、多路傳感器接入,完成360°環(huán)境感知、多傳感器融合、三維環(huán)境建模、定位、預(yù)測及語義地圖等功能。車載AI計算芯片是計算平臺的核心,下面就車載AI計算芯片展開進一步分析。

1.AI芯片發(fā)展趨勢分析

當前,算力不足已成為智能汽車發(fā)展的核心瓶頸。自動駕駛等級每增加一級,算力需求就有一個數(shù)量級的上升,業(yè)界已經(jīng)在討論車載計算的POPS(每秒1000萬億次運算)時代何時到來,這相當于把“天河一號”超級計算機(2010年建成,算力當時排名全球第一)裝進一臺汽車。硬件是由多種不同計算構(gòu)架的芯片組成的異構(gòu)計算平臺,其中最核心的部分是AI計算,其對算力的需求遠遠超過邏輯計算2個數(shù)量級以上??梢哉f,在智能汽車時代,AI計算芯片就是智能汽車的“數(shù)字發(fā)動機”。

感知對算力的需求是驚人的,自動駕駛車輛需要對其周邊360°范圍內(nèi)的環(huán)境進行感知,包括對移動物體的識別、跟蹤、預(yù)測,以及對駕駛環(huán)境的語義分割、建模和定位,感知的范圍非常廣,還要在不同的天氣情況、光照條件下可靠工作,這一切對感知算法的可靠性、準確性提出了極其苛刻的要求。這就要求計算平臺提供充沛的算力,來支撐感知算法的需求。

為達到可靠性、準確性的目標,感知需要多種傳感器進行融合,并在每一個維度上都進行冗余備份。隨著各種傳感器的性能持續(xù)提升,其需要處理的數(shù)據(jù)量也會呈幾何級增大,例如使用最廣的車載攝像頭,其像素已經(jīng)從100萬上升到800萬,并進一步向1200萬發(fā)展。激光雷達和毫米波雷達也在向圖像化方向發(fā)展。對自動駕駛處理器的算力需求也水漲船高。

目前,AI芯片的算力正在迅速提升,從幾個TOPS(每秒10000億次運算)的算力向上百個TOPS的算力發(fā)展(表2-2)。芯片制程也在從16nm向7nm演進,以確保功耗在可接受的范圍內(nèi)(圖2-2)。

表2-2 主要車載AI芯片公司的芯片算力

2.AI芯片架構(gòu)發(fā)展趨勢分析

目前,主流芯片架構(gòu)主要分為GPU(圖形處理單元)、FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)等流派,國外AI芯片的典型產(chǎn)品主要有英偉達的Xavier、Orin以及Mobileye的EyeQ5H等,如圖2-3和表2-3所示。國內(nèi)企業(yè),例如華為、地平線等也推出了ASIC架構(gòu)的產(chǎn)品。

圖2-2 運算速度和功耗對比

表2-3 ASIC架構(gòu)的產(chǎn)品

隨著深度學習從研究走向產(chǎn)業(yè)化,處理器效能正成為自動駕駛落地的關(guān)鍵挑戰(zhàn)。目前,英偉達的GPU平臺(如Pegasus)是自動駕駛領(lǐng)域最流行的計算平臺,通用性極佳。但GPU作為一個通用計算構(gòu)架,在應(yīng)對深度學習的計算方面,表現(xiàn)不夠高效,且有固有缺陷,包括內(nèi)存帶寬依然是瓶頸,缺乏足夠的On-Chip RAM,并行計算模式不夠靈活,對串行化算法無法優(yōu)化,雙精度/ ECC對深度學習意義不大。

這些問題直接導(dǎo)致基于GPU的解決方案計算單元利用率較低,功耗較大,成本較高,難以滿足自動駕駛系統(tǒng)量產(chǎn)的要求。另一方面,CNN的卷積操作以及CNN的算法演進都要求有專用的處理器來提供高效的解決方案,如圖2-4所示。

業(yè)界也在探索基于FPGA的解決方案,但FPGA成本依然偏高,且受限于內(nèi)部資源及較低的運行主頻,難以實現(xiàn)更高性能。相同工藝下,ASIC加速器的速度通常比FPGA加速器快5~10倍,而且量產(chǎn)后ASIC的成本遠低于FPGA,因此ASIC是未來自動駕駛車載平臺量產(chǎn)芯片的主流架構(gòu)。

圖2-3 不同架構(gòu)芯片對比圖

圖2-4 不同架構(gòu)的處理器在卷積神經(jīng)網(wǎng)絡(luò)CNN計算方面的效率對比

例如,CNN的卷積操作都需要大量中間結(jié)果的輸入和輸出,需要受操控的內(nèi)部RAM來進行結(jié)果暫存,減少對外部DDR的帶寬占用。GPU的緩存太少,而且透明(不受控制),專用DL構(gòu)架所使用的IRAM要比GPU的密度高很多。

現(xiàn)在的CNN都是一張大網(wǎng)絡(luò),而未來CNN會更加精致、異構(gòu)化,例如使用二值網(wǎng)絡(luò)與高精度浮點網(wǎng)絡(luò)的組合。從并發(fā)計算走向序列化計算,先進行一次預(yù)計算,然后選擇更合適的模型進一步計算。

ASIC是定制的專用AI芯片,可以滿足特定的應(yīng)用需求。它可以在硬件級別進行優(yōu)化,具有體積小、功耗低、高性能和低成本的特點。隨著人工智能算法和應(yīng)用技術(shù)的發(fā)展,定制的人工智能芯片ASIC逐漸展現(xiàn)出優(yōu)勢,非常適合人工智能應(yīng)用場景。

正如CPU改變了大型計算機一樣,ASIC芯片也將極大地改變AI硬件設(shè)備的面貌。AlphaGo使用約170個圖形處理單元和1200個中央處理單元(CPU)。這些設(shè)備需要計算機室、大功率空調(diào)和多個系統(tǒng)維護專家。如果使用專用芯片,則僅需一個普通存儲盒的空間,且功耗也會大幅降低。

例如,英偉達的Tesla V100可以為深度學習相關(guān)的模型訓練和推理應(yīng)用提供高達125 teraflops的張量計算,其數(shù)據(jù)處理速度是2014年推出的GPU系列的12倍。谷歌的TPU3.0使用8位低精度計算可節(jié)省晶體管,速度最高可達100 PFlops,并將硬件性能提高到按摩爾定律開發(fā)七年后的芯片水平。

由于AI算法的復(fù)雜性持續(xù)提升,且多種不同算法的融合成為發(fā)展趨勢,單純的GPU或ASIC都較難滿足車載AI計算的需求,目前的車載AI芯片發(fā)展趨勢是SoC化,集成異構(gòu)計算IP組合來滿足不同AI算法的需求,典型的異構(gòu)計算組合是CPU+NPU+GPU/DSP。其中,CPU完成邏輯計算,NPU完成CNN計算的加速,GPU/DSP提供通用算力,可用于實現(xiàn)NPU無法實現(xiàn)的計算操作,例如特定的算子。

圖2-5對比了特斯拉FSD芯片與英偉達Xavier芯片的架構(gòu)。

圖2-5 特斯拉FSD芯片與英偉達Xavier芯片的架構(gòu)對比

圖2-6展示了主流芯片的性能對比,反映出AI時代的一個重大趨勢:AI芯片設(shè)計不再由硬件公司主導(dǎo),算法定義芯片的范式轉(zhuǎn)移將帶來更高的計算效率,引領(lǐng)視覺處理器向高性能、低功耗、低成本的方向發(fā)展。

圖2-6 主流車載AI芯片關(guān)鍵性能對比

3.AI芯片典型架構(gòu)分析

隨著汽車智能化的迅速發(fā)展,國內(nèi)芯片供應(yīng)商,例如華為、地平線和芯馳等,抓住車企智能化轉(zhuǎn)型的時代機遇,發(fā)揮自己的核心優(yōu)勢,在芯片算力、功耗等核心指標方面迎頭趕上,不斷推出新的芯片產(chǎn)品。其中,地平線于2019年8月成功推出國內(nèi)首款車規(guī)級AI芯片征程2,并在2020年6月長安汽車發(fā)布的新車型UNI-T上實現(xiàn)前裝量產(chǎn),邁出了國產(chǎn)車規(guī)級AI芯片產(chǎn)業(yè)化的第一步。

征程2能高效、靈活地實現(xiàn)多類AI任務(wù)處理,對多類目標進行實時檢測和精準識別,可全面滿足自動駕駛視覺感知、視覺建圖定位和視覺ADAS等智能駕駛場景需求,以及語音識別、眼球跟蹤和手勢識別等智能人機交互功能需求,充分體現(xiàn)BPU架構(gòu)強大的靈活性,全方位賦能汽車智能化。征程2芯片具備極高的算力利用率,每TOPS AI能力輸出可達同等算力GPU的10倍以上。征程2還可提供高精度且低延遲的感知輸出,滿足典型場景對語義分割、目標檢測和目標識別的類別和數(shù)量需求。該芯片總體架構(gòu)如圖2-7所示。

AI處理器的核心是CNN計算處理單元,地平線的CNN計算處理單元稱為BPU,征程2屬于該公司的伯努利架構(gòu)BPU,是一種異構(gòu)多指令多數(shù)據(jù)(Heterogeneous Multiple Instruction Multiple Data)計算架構(gòu),如圖2-8所示。

伯努利架構(gòu)下的征程2處理器,在28nm工藝下可達4 TOPS的算力和2W的典型功耗。需要指出的是,BPU是針對深度學習算法預(yù)測過程的數(shù)據(jù)流進行優(yōu)化的,包括彈性張量核及異構(gòu)多指令多數(shù)據(jù)架構(gòu)設(shè)計。這使BPU在實際運行過程中,平均乘法器利用率(Utilization)超過90%,明顯優(yōu)于目前已知的各類AI處理器。

圖2-7 地平線征程2芯片的架構(gòu)及性能

圖2-8 伯努利架構(gòu)BPU架構(gòu)示意圖

伯努利架構(gòu)BPU核心的運算器件之一是彈性張量核(Elastic Tensor Core),可根據(jù)所需處理的數(shù)據(jù)類型相應(yīng)調(diào)整計算的模式,以最大化乘法器的利用效率。借助特殊設(shè)計的數(shù)據(jù)路由橋(Data Routing Bridge),BPU可以將多種運算器件(ALU)同時與多個靜態(tài)存儲倉庫(SRAM Bank)靈活地連接在一起,輔以編譯器(Compiler)和運行時(Runtime)策略的優(yōu)化,做到DDR數(shù)據(jù)的讀取或?qū)懭牒瓦\算,以及不同類型運算之間的同時運行。BPU需要設(shè)計一套指令集來支持各種深度學習算法。指令集是軟硬件之間的接口,AI算法經(jīng)編譯器翻譯成可執(zhí)行的指令,供AI處理器執(zhí)行。

伯努利架構(gòu)BPU的指令集支持AI運算中不同運算單元,包括卷積(Convolution)、池化(Pooling)、上采樣(Upscale)和Load/Store等,這些運算單元可異步并行執(zhí)行,以提高運算效率,減少計算時間和延時,并通過同步指令(Sync)解決數(shù)據(jù)依賴和計算資源(包括運算單元和存儲器)依賴的問題。這套指令集不僅支持主流深度學習網(wǎng)絡(luò),還支持最新的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),例如Resnet、MobileNet和Faster-RCNN,支持稀疏化網(wǎng)絡(luò)結(jié)構(gòu)、可變位寬數(shù)據(jù)和權(quán)重計算以及數(shù)據(jù)壓縮存儲等功能。該指令集的定義使AI處理器各運算單元之間并行度進一步提高,從而進一步提高了運算效率,并可高效地實現(xiàn)更加復(fù)雜和靈活的AI運算。

面向自動駕駛落地應(yīng)用的實際需求,地平線將在算法領(lǐng)域的前沿探索轉(zhuǎn)化為賦能產(chǎn)業(yè)的落地實踐,深度融合具有創(chuàng)新性和前瞻性的高效感知算法和極致效能的車規(guī)級AI芯片,打造高效的智能駕駛感知解決方案,賦能客戶,加速智能駕駛的應(yīng)用落地。

地平線在CES 2020推出新一代自動駕駛計算平臺——Matrix 2,如圖2-9所示。該平臺面向多層次、多場景的未來自動駕駛,搭載地平線征程二代車規(guī)級芯片,具備極致性能與高可靠性,可滿足L2~L4級自動駕駛需求,為自動駕駛客戶提供感知層的深度賦能。

圖2-9 地平線自動駕駛計算平臺Matrix 2

主要參數(shù):

· 基于地平線征程二代處理器架構(gòu)

· 支持8大類像素級語義分割,支持多類物體檢測識別

· 視頻輸入:單路1080P@60fps,4路1080P@15fps

· 等效算力:40 TOPS

· 低延時,系統(tǒng)級別每幀60ms延時

· 無需主動散熱,功耗20W

迭代后的Matrix 2具備更高性能、更低功耗,可滿足不同場景下高級別自動駕駛運營車隊以及無人低速小車的感知計算需求。Matrix 2在性能方面有16TOPS的等效算力,而功耗僅為上一代的2/3。

在感知層面,Matrix 2可支持包括攝像頭、激光雷達在內(nèi)的多傳感器感知和融合,實現(xiàn)高達23類語義分割以及6大類目標檢測。值得一提的是,地平線在Matrix 2上實現(xiàn)的感知算法還能應(yīng)對復(fù)雜環(huán)境,支持在特殊場景或極端天氣情況下輸出穩(wěn)定的感知結(jié)果。

2.1.3.3 智能底盤

智能底盤平臺主要包括智能汽車的執(zhí)行器平臺和車載總線。執(zhí)行器主要指執(zhí)行計算平臺發(fā)出的控制指令的機械結(jié)構(gòu),由于現(xiàn)在的無人駕駛汽車大多由成熟的汽車平臺改造而來,執(zhí)行器的主要控制對象是加速踏板(速度控制)、制動踏板(制動控制)和轉(zhuǎn)向盤(轉(zhuǎn)向控制)。

1.轉(zhuǎn)向線控技術(shù)

線控轉(zhuǎn)向系統(tǒng)取消了轉(zhuǎn)向盤與轉(zhuǎn)向器之間的機械聯(lián)接,直接通過電信號控制轉(zhuǎn)向電機驅(qū)動車輪轉(zhuǎn)向,主要由轉(zhuǎn)向盤總成、轉(zhuǎn)向執(zhí)行器和主控制器組成,如圖2-10所示。

圖2-10 線控轉(zhuǎn)向系統(tǒng)簡圖

轉(zhuǎn)向盤總成由轉(zhuǎn)向盤、轉(zhuǎn)角傳感器、轉(zhuǎn)矩傳感器和路感電機組成。轉(zhuǎn)向盤轉(zhuǎn)動時帶動轉(zhuǎn)角傳感器的大齒輪轉(zhuǎn)動,大齒輪帶動裝有磁體的兩個小齒輪轉(zhuǎn)動,產(chǎn)生變化的磁場,通過敏感電路檢測磁場變化產(chǎn)生的轉(zhuǎn)角信號,通過CAN總線將數(shù)據(jù)發(fā)送出去。轉(zhuǎn)矩傳感器的檢測原理與之類似。路感電機用于將主控制器傳來的回正信號轉(zhuǎn)化為回正力矩,向駕駛?cè)藗鬟f路感。轉(zhuǎn)向執(zhí)行器負責快速響應(yīng)主控制器傳來的轉(zhuǎn)角信號,完成車輛的轉(zhuǎn)向。主控制器的作用是采集各傳感器發(fā)來的信息和數(shù)據(jù),計算出合理的決策數(shù)據(jù)后發(fā)給各執(zhí)行器。

2.速度線控技術(shù)

線控加速踏板的工作原理是當駕駛?cè)瞬认录铀偬ぐ鍟r,其操作意圖被加速踏板位置傳感器感知,轉(zhuǎn)化為相應(yīng)的電信號,輸送給電子控制單元。電子控制單元得到信號后,結(jié)合當前發(fā)動機的狀態(tài),控制節(jié)氣門的開度和位置,然后節(jié)氣門位置傳感器又把當前的節(jié)氣門開度信息反饋給電子控制單元,進行閉環(huán)控制,這樣就使發(fā)動機可以工作在最優(yōu)狀態(tài)。線控加速踏板系統(tǒng)除控制精度高、結(jié)構(gòu)簡單外,還可根據(jù)汽車的工況以及發(fā)動機的工作狀態(tài),結(jié)合加速踏板的位置,實時調(diào)節(jié)節(jié)氣門的位置,減少不必要的噴油,提高發(fā)動機的工作效率。

3.制動線控技術(shù)

線控制動將原有的制動踏板用一個模擬發(fā)生器替代,用以接收駕駛?cè)说闹苿右鈭D,產(chǎn)生、傳遞制動信號給控制和執(zhí)行機構(gòu),并根據(jù)一定的算法模擬反饋給駕駛?cè)耍▓D2-11)。顯而易見,這需要非常安全可靠的結(jié)構(gòu),以正常工作。

圖2-11 線控制動原理

電子液壓制動系統(tǒng)(Electro Hydraulic Braking, EHB)是在傳統(tǒng)液壓制動系統(tǒng)基礎(chǔ)上發(fā)展而來的,兩者的最大的區(qū)別在于:EHB用電子元件替代傳統(tǒng)液壓制動系統(tǒng)中的部分機械元件,即用綜合制動模塊取代助力器、壓力調(diào)節(jié)器和ABS模塊。典型EHB由踏板位移傳感器、電子控制單元(Electronic Control Unit,ECU)、執(zhí)行器機構(gòu)等組成。正常工作時,制動踏板與制動器之間的液壓連接斷開,備用閥處于關(guān)閉狀態(tài)。電子踏板配有踏板感覺模擬器和電子傳感器,ECU可通過傳感器信號判斷駕駛?cè)说闹苿右鈭D,并通過電機驅(qū)動液壓泵進行制動。電子系統(tǒng)發(fā)生故障時,備用閥打開,EHB變?yōu)閭鹘y(tǒng)液壓系統(tǒng)。EHB具有冗余系統(tǒng),安全性更具優(yōu)勢,且產(chǎn)品成熟度高,目前各大供應(yīng)商都在推廣相關(guān)產(chǎn)品。

4.車載CAN總線

CAN總線又稱汽車總線,全稱為“控制器局域網(wǎng)”(Controller Area Network),意為區(qū)域網(wǎng)絡(luò)控制器,它將各單一控制單元以某種形式(多為星形)連接起來,形成一個完整系統(tǒng)。在該系統(tǒng)中,各控制單元都以相同的規(guī)則進行數(shù)據(jù)傳輸、交換和共享,這稱為數(shù)據(jù)傳輸協(xié)議。CAN總線最早是德國博世公司為解決現(xiàn)代汽車中眾多ECU之間的數(shù)據(jù)交換問題而開發(fā)的一種串行通信協(xié)議。CAN作為一種多主總線,支持分布式實時控制的通信網(wǎng)絡(luò),采用了許多新技術(shù)及獨特設(shè)計,具有可靠性、實時性和靈活性。其特點如下:

1)CAN為多主方式工作,網(wǎng)絡(luò)上任一節(jié)點均可在任意時刻主動向網(wǎng)絡(luò)上其他節(jié)點發(fā)送信息,不分主從,通信方式靈活。

2)CAN網(wǎng)絡(luò)上的節(jié)點信息分成不同優(yōu)先級,可滿足不同實時要求,高優(yōu)先級的數(shù)據(jù)可在134μs內(nèi)得到傳輸。

3)CAN只需通過幀濾波即可實現(xiàn)通過點對點、一點對多點及全局廣播等方式傳送/接收數(shù)據(jù),無須專門“調(diào)度”。

4)CAN的通信介質(zhì)可為雙絞線、同軸電纜或光纖,選擇靈活。

5)CAN節(jié)點在錯誤嚴重的情況下具有自動關(guān)閉輸出功能,以使總線上其他節(jié)點的操作不受影響。

主站蜘蛛池模板: 浠水县| 剑阁县| 临高县| 阳城县| 三穗县| 咸丰县| 建阳市| 阿瓦提县| 团风县| 手游| 林州市| 商河县| 偏关县| 天柱县| 额济纳旗| 达日县| 长岛县| 富源县| 酒泉市| 胶南市| 高台县| 龙游县| 保康县| 离岛区| 宁武县| 阜平县| 庆元县| 德兴市| 遂昌县| 朝阳市| 邯郸县| 涞源县| 刚察县| 昭觉县| 渝北区| 永清县| 馆陶县| 嘉禾县| 三河市| 景洪市| 蒙阴县|