- 自動駕駛:感知原理與實踐
- 龔心滿等編著
- 529字
- 2023-09-07 19:26:20
1.3.3 GoogLeNet
GoogLeNet由GoogleAI團隊于2014年提出(出自論文Going Deeper with Convolutions),并在當年的 ImageNet 競賽的圖像分類任務中獲得第一名(注意:GoogLeNet中的L大寫是為了向LeNet致敬),VGG網絡也在當年由牛津大學提出。圖1.11所示為GoogLeNet架構圖。
GoogLeNet相比于VGG和AlexNet的優點如下。
● 引入了Inception模塊(融合不同尺度的特征信息)。
● 1×1卷積核用于降維和映射。
● 添加了兩個輔助分類器來輔助訓練。
● 丟棄全連接層,使用平均池化(Average Pooling)層(大大減少了模型參數量,推理時去掉兩個輔助分類器,其網絡大小只有VGG的1/20)。
GoogLeNet提出了具有良好局部特征結構的Inception模塊,即可以并行進行多個卷積(Convolution)操作和不同大小的特征池化操作,最后拼接在一起。由于1×1、3×3 和5×5 卷積操作對應不同的特征圖區域,所以這樣做的好處是可以獲得更好的圖像表示信息。為了在深度方向拼接4個分支的輸出,需要保證4個分支輸出的特征圖的高和寬相同。
如圖1.12所示,Inception模塊使用4個卷積核進行卷積操作,并將這4部分級聯(通道拼接)后傳遞到下一層。

圖1.11 GoogLeNet架構圖

圖1.12 Inception基礎模塊結構(s代表步長)
在上述Inception模塊的基礎上,為了進一步減少網絡參數量,增加了多個1×1卷積模塊,如圖1.13所示。這些1×1卷積模塊主要用來對特征進行降維處理,并送給3×3和5×5卷積核。由于通道數量的減少,參數量大大減少。

圖1.13 Inception模塊改進結構