- 自動駕駛:感知原理與實踐
- 龔心滿等編著
- 615字
- 2023-09-07 19:26:19
1.3 經典卷積神經網絡
1.3.1 AlexNet
AlexNet(出自論文ImageNet Classification with Deep Convolutional Neural Networks)是Hinton和他的學生Alex Krizhevsky在2012年ImageNet競賽中使用的模型結構,刷新了 Image Classification 榜單。從此,深度學習方法在圖像領域開始一次次超過state-of-art,甚至達到超越人類的地步。圖1.8所示為AlexNet架構圖。AlexNet總共包括8層,其中前5層為卷積層,后3層為全連接層。AlexNet在原始論文中說明,如果減少任何一個卷積層,那么結果會變得很差。下面具體介紹AlexNet的元素構成。
第1層卷積層:輸入為圖像,首先使用96個卷積核進行卷積操作,并以4為步長來右移或下移;然后進行最大池化(Max-Pooling),池化尺寸=(3,3),步長為2,得到輸出特征的形狀為96×55×55。
第2層卷積層:首先使用填充尺寸=2的操作對上一層得到的特征圖進行填充;然后使用256個卷積核進行卷積操作,以1為步長移動;最后進行最大池化,池化尺寸=(3,3),步長為2,得到輸出特征的形狀為256×27×27。
第3層卷積層:使用384個卷積核進行卷積操作,步長為1,得到輸出特征的形狀為384×13×13。
第4層卷積層:首先使用填充尺寸=1的操作對上一層得到的特征圖進行填充;然后使用384個卷積核進行卷積操作,步長為1,得到輸出特征的形狀為384×13×13。
第5層卷積層:首先使用填充尺寸=1的操作對上一層得到的特征圖進行填充;然后使用256個卷積核進行卷積操作,步長為1,得到輸出特征的形狀為256×13×13;最后進行最大池化,池化尺寸=(3,3),步長為2,得到輸出特征的形狀為256×13×13。
全連接層:前兩層分別有4096個神經元,最后輸出Softmax為1000個(ImageNet有1000個類別)。

圖1.8 AlexNet架構圖