- 自動駕駛:感知原理與實踐
- 龔心滿等編著
- 788字
- 2023-09-07 19:26:17
1.2 卷積神經(jīng)網(wǎng)絡(luò)
1.2.1 卷積
卷積是分析數(shù)學(xué)的一種重要運算,也是卷積神經(jīng)網(wǎng)絡(luò)的基石。在計算機(jī)視覺領(lǐng)域,所提到的卷積通常指二維卷積,即離散的二維濾波器(也稱為卷積核)。對于單通道卷積,其計算方式如圖1.4所示。
二維圖像的卷積可以理解為二維濾波器滑過二維圖像上的所有位置,并在每個位置與該二維圖像對應(yīng)位置像素進(jìn)行內(nèi)積。如圖1.4所示,輸入為一個(3×3)像素的二維圖像,二維濾波器的尺寸為(2×2)像素,滑動的步長為1像素(本書后面涉及圖像的單位均為像素),卷積后的輸出為圖1.4中最右邊的結(jié)果。

圖1.4 單通道卷積的計算方式
卷積廣泛應(yīng)用于圖像處理領(lǐng)域,不同的卷積核可以提取不同的特征,如邊緣、線性、角點等。在深層卷積神經(jīng)網(wǎng)絡(luò)中,通過卷積可以提取圖像的復(fù)雜特征。
受益于生物學(xué)中的視覺系統(tǒng)結(jié)構(gòu),卷積的設(shè)計也擁有局部連接特性,每個神經(jīng)元僅與輸入神經(jīng)元的一塊區(qū)域連接,這塊區(qū)域稱為感受野(Receptive Field)。在圖像卷積操作中,神經(jīng)元在空間維度上是局部連接的,但在深度上是全連接的。
二維圖像本身的局部像素關(guān)聯(lián)較強,這種局部連接保證了學(xué)習(xí)后的二維濾波器能夠?qū)植枯斎胩卣饔休^強的響應(yīng)。此外,卷積還有權(quán)重共享特性,即在計算同一個神經(jīng)元時采用的二維濾波器是共享的,這樣可以在很大程度上減少參數(shù)量。
共享權(quán)重在一定程度上是很有意義的,如圖像的底層邊緣特征與其在圖像中的具體位置無關(guān)。但是,在一些場景中共享權(quán)重又是無意義的。例如,輸入的圖像是人臉、眼睛和頭發(fā),這些部位是處于人體的不同位置上的,卷積神經(jīng)網(wǎng)絡(luò)模型希望在不同的位置學(xué)到不同的特征。
在卷積層,通常采用多組卷積核提取不同的特征,即對應(yīng)不同通道的特征,不同卷積核的權(quán)重是不共享的。
通過介紹卷積的計算過程及其特性可以看出卷積是線性操作,并具有平移不變性。平移不變性是指在圖像的每個位置執(zhí)行相同的操作。卷積層的局部連接和權(quán)重共享特性使卷積神經(jīng)網(wǎng)絡(luò)需要學(xué)習(xí)的參數(shù)量大大減少,有利于訓(xùn)練較大的卷積神經(jīng)網(wǎng)絡(luò)。