書名: 深度學習之圖像目標檢測與識別方法作者名: 史朋飛等本章字數: 2291字更新時間: 2024-10-18 15:06:01
0.3 本書的主要內容及章節安排如下
針對傳統圖像去霧算法容易受到先驗知識制約和顏色失真等問題,第1章提出了一種結合注意力機制的多尺度特征融合圖像去霧算法。該算法采用下采樣層來提取圖像中的多尺度特征圖,并且采用跳躍連接的方式對不同尺度的特征圖進行融合,同時在跳躍連接中加入了由通道注意力模塊和像素注意力模塊組成的特征注意力模塊,使該算法可以將更多的注意力集中在濃霧像素區域和重要通道信息上。實驗表明,該算法能夠克服其他幾種主流的去霧算法容易受到先驗知識制約以及顏色失真的缺點,可得到較為清晰的無霧圖像,圖像色彩失真小,去霧性能優于其他幾種流行的去霧算法。
針對水下圖像受水下特殊環境的影響而存在的顏色失真、對比度和清晰度低等問題,第2章提出了一種基于特征融合GAN的水下圖像增強算法。本章首先通過生成器和判別器之間的對抗訓練,獲得了魯棒性較高的水下圖像增強模型,主要包括改進的顏色校正算法、生成器的結構、判別器的結構和訓練過程中模型的損失函數;然后通過實驗對比了該算法和典型的傳統圖像增強算法、近幾年提出的基于深度學習的圖像增強算法,證明了該算法的有效性;最后,通過消融實驗,證明了特征融合結構和邊緣損失函數對該算法的貢獻。
在水下圖像的獲取和傳輸過程中,由于成像設備速度、網絡傳輸帶寬的限制,需要將水下圖像壓縮成低分辨率的圖像,低分辨率的圖像會造成信息量小、特征提取難等問題。針對這些問題,第3章設計了基于ESRGAN的水下圖像超分辨重建算法。第3 章首先闡述了基于 SERGAN 的圖像超分辨率重建算法 SRGAN 和 ESRGAN,以及ESRGAN對于SRGAN的主要改進;其次,介紹了該算法的改進之處,詳細說明了生成器和相對判別器的結構及作用,同時介紹了訓練過程中模型的損失函數;最后,通過實驗對比了該算法和其他典型的圖像超分辨率重建算法,證明了該算法的有效性。
在對實時性要求較高的裂縫圖像檢測系統中,傳統方法無法完成對裂縫大批量的檢測,為更加快速、精確地分割裂縫圖像,第4章提出了一種新的結合自注意力機制的基于嵌套UNet的裂縫圖像分割模型Att_Nested_UNet。該模型沿用UNet模型的設計思想,使用將多層UNet嵌套在一起的UNet++模型,并在每層的UNet模型中融入了注意力機制。第4章在包含8700幅裂縫圖像的訓練集、包含1290幅裂縫圖像的測試集上的驗證了 Att_Nested_UNet 模型的有效性,無論從主觀視覺效果來看,還是從客觀性能指標來看,Att_Nested_UNet模型在裂縫圖像分割中的表現要優于UNet++、Att_UNet、UNet模型。
針對水下大壩裂縫圖像分割任務面臨的可用數據集少、人工標注耗時費力、難以實現有監督學習等問題,第5章提出了一種基于對抗遷移學習的水下大壩裂縫圖像分割算法。第5章通過構建多級特征對抗網絡,將在源域(有標注的地面裂縫圖像)上提取到的特征應用到水下大壩裂縫圖像分割中,有效緩解了對水下標注數據集的需求,并在一定程度上保證了分割精度。
由于水下圖像質量低下、水下環境復雜、海洋生物大小形態不一、重疊遮擋等原因,傳統的基于Faster-RCNN的海洋生物檢測算法(原算法)對海洋生物的檢測效果并不理想。第6章提出了一種基于改進Faster-RCNN的海洋生物檢測算法。該算法使用ResNet替代原算法中的VGG特征提取網絡,并輔以BiFPN提升特征提取能力和多尺度特征融合能力;使用有效交并比(EIoU)替換交并比(IoU)以減少邊界框的冗余;使用K-means++算法生成合適的錨定框。實驗表明,該算法有效提高了海洋生物的檢測精度,可以實現對海洋生物的有效檢測。
針對水下圖像質量差、水下目標形態各異大小不一,以及水下目標重疊或遮擋導致水下目標檢測精度低的問題,第7章提出了一種在YOLOv4上使用PredMix、卷積塊注意力模塊(Convolutional Block Attention Module,CBAM)和DetPANet的目標檢測算法。第7章在YOLOv4的特征提取網絡CSPDarknet53中添加CBAM,可以提高算法的特征提取能力;DetPANet在路徑聚合網絡(Path Aggregation Network,PANet)中添加了同層跳躍連接結構和跨層跳躍連接結構,可以增強算法的多尺度特征融合能力;PredMix(Prediction-Mix)可以增強算法的魯棒性。實驗結果表明,該算法有效提高了水下目標的檢測精度。
針對遙感圖像中某些地物目標密集排列的難點問題,第8章提出了一種基于RetinaNet密集目標檢測算法。首先,針對密集目標間存在噪聲干擾的問題,該算法在RetinaNet算法中加入一個由空間注意力模塊與通道注意力模塊組成的多維注意力模塊,用來抑制噪聲;然后,使用弱化的非極大值抑制算法替代非極大值抑制算法,用于防止某些密集目標被剔除。第8章的消融實驗結果表明,該算法在檢測準確率方面優于RetinaNet算法;對比實驗結果表明,該算法的目標檢測性能優于所對比的6種目標檢測算法。因此,該算法在檢測遙感圖像中的密集目標時具有較高的檢測準確率,能在一定程度上解決遙感圖像中地物目標密集排列的難點問題。
針對視頻圖像目標檢測算法由于運動模糊和噪聲而出現的漏檢問題,第9章提出了一種基于LSTM網絡的視頻圖像目標檢測算法。該算法通過改進的記憶引導網絡,實現了幀間特征的傳遞和聚合;通過大小不同的模型對視頻圖像進行交叉檢測,大模型負責檢測精度的提升,小模型負責檢測速度的提升,在數據集上實現了端到端的訓練。與單幀圖像目標檢測算法相比,該算法解決了由于運動目標姿勢異常、復雜背景干擾和目標部分缺失等造成的漏檢問題。與其他主流的視頻圖像目標檢測算法相比,該算法取得了更優或者相近的性能。
針對目標檢測算法參數量大、占用資源多、難以部署到嵌入式平臺上的問題,第10章提出了一種基于改進YOLOv4的嵌入式變電站儀表檢測算法。該算法在YOLOv4的基礎上進行了輕量化改進,采用MobileNet V3作為特征提取網絡,引入深度可分離卷積,采用遷移學習策略進行網絡訓練,利用TensorRT對模型進行優化,更適用于性能有限的嵌入式平臺。實驗結果表明,該算法在變電站儀表檢測中表現出了良好的魯棒性和實時性,能夠滿足變電站儀表檢測任務,方便在不同的變電站中遷移部署,具有很好的實用價值。
- 3ds Max網絡游戲模型貼圖火星課堂
- Illustrator CS6標準培訓教程
- Nuke高級數字藝術合成火星風暴(第2版)
- 攝影后期與短視頻剪輯零基礎一本通
- 影視后期制作(After Effects+3ds Max)
- 動靜之美:Sketch移動UI與交互動效設計詳解
- 影視后期制作基礎與應用教程(After Effects CS5)
- Adobe Premiere Pro CS5經典教程
- AutoCAD+3ds Max+Photoshop室內設計效果圖制作藝術
- 我的第一本Photoshop CS5數碼照片處理書
- After Effects影視特效制作208例
- Photoshop CS6從入門到精通
- After Effects CS6完全自學教程(第2版)
- Photoshop七大核心技術
- 短視頻創作:視頻拍攝與運鏡、設備選擇與操作、鏡頭美感與設計、內容策劃與運營