- 自動(dòng)駕駛:感知原理與實(shí)踐
- 龔心滿等編著
- 7字
- 2023-09-07 19:26:17
1.2 卷積神經(jīng)網(wǎng)絡(luò)
1.2.1 卷積
卷積是分析數(shù)學(xué)的一種重要運(yùn)算,也是卷積神經(jīng)網(wǎng)絡(luò)的基石。在計(jì)算機(jī)視覺領(lǐng)域,所提到的卷積通常指二維卷積,即離散的二維濾波器(也稱為卷積核)。對(duì)于單通道卷積,其計(jì)算方式如圖1.4所示。
二維圖像的卷積可以理解為二維濾波器滑過二維圖像上的所有位置,并在每個(gè)位置與該二維圖像對(duì)應(yīng)位置像素進(jìn)行內(nèi)積。如圖1.4所示,輸入為一個(gè)(3×3)像素的二維圖像,二維濾波器的尺寸為(2×2)像素,滑動(dòng)的步長(zhǎng)為1像素(本書后面涉及圖像的單位均為像素),卷積后的輸出為圖1.4中最右邊的結(jié)果。

圖1.4 單通道卷積的計(jì)算方式
卷積廣泛應(yīng)用于圖像處理領(lǐng)域,不同的卷積核可以提取不同的特征,如邊緣、線性、角點(diǎn)等。在深層卷積神經(jīng)網(wǎng)絡(luò)中,通過卷積可以提取圖像的復(fù)雜特征。
受益于生物學(xué)中的視覺系統(tǒng)結(jié)構(gòu),卷積的設(shè)計(jì)也擁有局部連接特性,每個(gè)神經(jīng)元僅與輸入神經(jīng)元的一塊區(qū)域連接,這塊區(qū)域稱為感受野(Receptive Field)。在圖像卷積操作中,神經(jīng)元在空間維度上是局部連接的,但在深度上是全連接的。
二維圖像本身的局部像素關(guān)聯(lián)較強(qiáng),這種局部連接保證了學(xué)習(xí)后的二維濾波器能夠?qū)植枯斎胩卣饔休^強(qiáng)的響應(yīng)。此外,卷積還有權(quán)重共享特性,即在計(jì)算同一個(gè)神經(jīng)元時(shí)采用的二維濾波器是共享的,這樣可以在很大程度上減少參數(shù)量。
共享權(quán)重在一定程度上是很有意義的,如圖像的底層邊緣特征與其在圖像中的具體位置無關(guān)。但是,在一些場(chǎng)景中共享權(quán)重又是無意義的。例如,輸入的圖像是人臉、眼睛和頭發(fā),這些部位是處于人體的不同位置上的,卷積神經(jīng)網(wǎng)絡(luò)模型希望在不同的位置學(xué)到不同的特征。
在卷積層,通常采用多組卷積核提取不同的特征,即對(duì)應(yīng)不同通道的特征,不同卷積核的權(quán)重是不共享的。
通過介紹卷積的計(jì)算過程及其特性可以看出卷積是線性操作,并具有平移不變性。平移不變性是指在圖像的每個(gè)位置執(zhí)行相同的操作。卷積層的局部連接和權(quán)重共享特性使卷積神經(jīng)網(wǎng)絡(luò)需要學(xué)習(xí)的參數(shù)量大大減少,有利于訓(xùn)練較大的卷積神經(jīng)網(wǎng)絡(luò)。
- 汽車總體設(shè)計(jì)(第2版)
- 深度學(xué)習(xí)及自動(dòng)駕駛應(yīng)用
- 汽車自動(dòng)變速器構(gòu)造與檢修
- 汽車發(fā)動(dòng)機(jī)電控系統(tǒng)檢修
- 城市軌道交通信號(hào)專業(yè)英語
- 輕松守住12分
- 日立挖掘機(jī)維修手冊(cè)(上冊(cè))
- 工務(wù)安全突發(fā)事件應(yīng)急處理與預(yù)防
- 新手開車如何遠(yuǎn)離交通事故
- 汽車電工入門到精通全圖解
- 公路隧道工程施工安全技術(shù)與風(fēng)險(xiǎn)控制
- 新能源汽車概論
- 卡羅拉車系快修速查手冊(cè)
- 高速鐵路GSM—R網(wǎng)絡(luò)優(yōu)化及故障處理典型案例
- 汽車運(yùn)動(dòng)百年史話