官术网_书友最值得收藏!

1.3.2 VGG

VGG是由Oxford Visual Geometry Group提出的(出自論文Very Deep Convolutional Networks for Large-Scale Image Recognition)。VGG的主要工作是證明增加網絡的深度能夠在一定程度上影響網絡最終的性能。VGG 有兩種結構,分別是 VGG16 和VGG19,兩者并沒有本質上的區別,只是網絡深度不一樣。

下面先認識一下VGG的基本架構,如圖1.9所示。

圖1.9 VGG的基本架構

VGG相比于AlexNet的一個改進是采用連續的幾個3×3卷積核代替AlexNet中較大的卷積核(11×11、7×7、5×5)。對于給定的特征,采用堆疊的小卷積核優于采用大卷積核,因為多個非線性層的疊加可以增加網絡深度,以此來保證模型可以學習更復雜的特征,而且計算復雜度比較低(參數量更少)。

簡單來說,在VGG中,使用3個3×3卷積核可以代替1個7×7卷積核,使用2個3×3卷積核可以代替1個5×5卷積核。這樣做的主要目的是在保證網絡具有相同感受野的前提下增加網絡的深度,在一定程度上改善模型的性能。例如,3個步長為1的3×3卷積核的疊加作用可看作1個卷積核尺寸為7×7的感受野。簡單來說,連續的3個3×3卷積就相當于1個7×7卷積,其參數量為27× C2。如果直接使用7×7卷積核,則其參數量為49×C2。這里的 C 指的是輸入和輸出的通道數。很明顯,27×C2小于49×C2,即減少了參數量。此外,3×3卷積可以更好地保持圖像特性。

為什么VGG選擇了這種用多個小卷積核代替大卷積核的方案呢?這里簡單解釋一下:5×5卷積可以看作1個小的全連接網絡在5×5區域滑動(卷積操作),可以先用1個3×3卷積,再用1個3×3卷積輸出,這樣就可以用2個連續的3×3卷積級聯(疊加)起來代替1個5×5卷積,如圖1.10所示。

圖1.10 3×3卷積與5×5卷積示意圖

主站蜘蛛池模板: 三原县| 鹤山市| 兴义市| 青铜峡市| 堆龙德庆县| 若尔盖县| 盘山县| 台江县| 云和县| 枣阳市| 墨玉县| 新民市| 桑植县| 黎平县| 搜索| 随州市| 峨眉山市| 巴林右旗| 乐都县| 辽阳县| 道孚县| 双江| 耿马| 瑞丽市| 广平县| 阿荣旗| 昌江| 宜兰县| 龙江县| 满洲里市| 皮山县| 兴业县| 兴宁市| 西宁市| 湖南省| 柳河县| 正定县| 合江县| 东台市| 深水埗区| 花垣县|