官术网_书友最值得收藏!

1.2 卷積神經網絡

1.2.1 卷積

卷積是分析數學的一種重要運算,也是卷積神經網絡的基石。在計算機視覺領域,所提到的卷積通常指二維卷積,即離散的二維濾波器(也稱為卷積核)。對于單通道卷積,其計算方式如圖1.4所示。

二維圖像的卷積可以理解為二維濾波器滑過二維圖像上的所有位置,并在每個位置與該二維圖像對應位置像素進行內積。如圖1.4所示,輸入為一個(3×3)像素的二維圖像,二維濾波器的尺寸為(2×2)像素,滑動的步長為1像素(本書后面涉及圖像的單位均為像素),卷積后的輸出為圖1.4中最右邊的結果。

圖1.4 單通道卷積的計算方式

卷積廣泛應用于圖像處理領域,不同的卷積核可以提取不同的特征,如邊緣、線性、角點等。在深層卷積神經網絡中,通過卷積可以提取圖像的復雜特征。

受益于生物學中的視覺系統結構,卷積的設計也擁有局部連接特性,每個神經元僅與輸入神經元的一塊區域連接,這塊區域稱為感受野(Receptive Field)。在圖像卷積操作中,神經元在空間維度上是局部連接的,但在深度上是全連接的。

二維圖像本身的局部像素關聯較強,這種局部連接保證了學習后的二維濾波器能夠對局部輸入特征有較強的響應。此外,卷積還有權重共享特性,即在計算同一個神經元時采用的二維濾波器是共享的,這樣可以在很大程度上減少參數量。

共享權重在一定程度上是很有意義的,如圖像的底層邊緣特征與其在圖像中的具體位置無關。但是,在一些場景中共享權重又是無意義的。例如,輸入的圖像是人臉、眼睛和頭發,這些部位是處于人體的不同位置上的,卷積神經網絡模型希望在不同的位置學到不同的特征。

在卷積層,通常采用多組卷積核提取不同的特征,即對應不同通道的特征,不同卷積核的權重是不共享的。

通過介紹卷積的計算過程及其特性可以看出卷積是線性操作,并具有平移不變性。平移不變性是指在圖像的每個位置執行相同的操作。卷積層的局部連接和權重共享特性使卷積神經網絡需要學習的參數量大大減少,有利于訓練較大的卷積神經網絡。

主站蜘蛛池模板: 南岸区| 潞城市| 江口县| 屯留县| 曲水县| 湟中县| 那坡县| 南乐县| 突泉县| 舟曲县| 万源市| 绥芬河市| 台东市| 雅江县| 满洲里市| 长宁县| 高雄市| 大庆市| 苍溪县| 垣曲县| 沁阳市| 延吉市| 峨山| 安顺市| 康乐县| 车致| 德清县| 红安县| 通城县| 珠海市| 正宁县| 桐庐县| 淄博市| 和平县| 桂林市| 腾冲县| 平遥县| 静乐县| 英吉沙县| 靖江市| 隆化县|