官术网_书友最值得收藏!

0.2.3 裂縫圖像分割算法研究

裂縫圖像分割算法可分為形態學方法和深度學習方法兩類[45]。在深度學習方法流行前,形態學方法是研究人員利用數字圖像處理、拓撲學、數學等方面知識來實現圖像分割的主要方法[46]。這類方法容易受圖像質量、噪聲等因素的影響,對使用環境有較高的要求。相較于深度學習方法,形態學方法的適用性較差,其分割性能和深度學習方法存在著一定的差距。

隨著深度學習的不斷發展,越來越多的研究人員將其應用到裂縫圖像分割任務中[47]。裂縫因其紋理特征較為復雜,對模型的分割性能提出了較高的要求。目前,在裂縫圖像分割領域中,應用較多的是全卷積網絡(Fully Convolutional Network,FCN)及其變體[48]。FCN于2015年由Long等人[49]提出,由編碼器子網絡和解碼器子網絡兩部分構成。其中,編碼器子網絡用于提取圖像特征,解碼器子網絡負責對圖像像素進行分類。由于FCN的解碼器子網絡過于簡單,其分割效果并不理想,常常出現誤判的情況。

Ronneberger等人[50]在FCN基礎上提出了UNet,它通過跳躍連接(Skip Connection,也稱為跳層連接)實現了醫學圖像不同層特征在語義上的融合。與 UNet 類似的還有SegNet[51],SegNet 使用編碼器子網絡池化操作生成的索引實現了圖像語義特征的融合。與FCN相比,這些改進的算法將網絡結構改成了對稱結構,豐富了解碼器子網絡輸出的語義特征,有效提升了圖像分割的精度。

雖然UNet和SegNet的提出并不是為了解決水下大壩裂縫圖像分割問題,但它們的有效性已經取得了證明。Huyan Ju等人[52]基于UNet提出了一種改進的道路裂縫圖像分割網絡——CrackUNet,借助填充(Padding)操作,CrackUNet可以保持特征圖(Feature Map)的尺寸不變。Cheng等人[53]基于UNet提出了一種像素級道路裂縫圖像分割方案,通過引入基于距離變換的損失函數(Loss Function based on Distance Transform),該方案取得了較高的像素級精度(Pixel-Level Accuracy)。Li 等人[54]在SegNet 的基礎上融入Dense Block,提出了一種新的混凝土結構裂縫圖像檢測算法。Zou等人[55]將多尺度特征跨層融合應用到了SegNet中,提出了一種名為DeepCrack的裂縫圖像檢測算法。

雖然上述方法可以有效提升地面裂縫圖像的分割精度,但將它們直接應用到水下大壩裂縫圖像分割任務中還存在一些問題。由于上述方法均屬于有監督學習方法,其模型訓練需要大量的有標簽數據。鑒于水下大壩裂縫圖像獲取困難、數據集標注耗時費力,對水下大壩裂縫圖像分割采用有監督學習是難以實現的。

水下大壩裂縫圖像不同于地面裂縫圖像,由于圖像采集系統的限制,大部分水下圖像質量較差[56]。水下大壩裂縫圖像的對比度低,所含的信息量較少,且含有大量的隨機噪聲和黑點,這給裂縫圖像的特征提取和分割帶來了很大的困難[57]。常規的處理水下大壩裂縫圖像的方法為:首先對原始圖像進行圖像增強,然后對增強后的圖像進行分割。馬金祥等人[58]提出了一種基于改進暗通道先驗的水下大壩裂縫圖像自適應增強算法,該算法可以有效抑制水下圖像的噪聲,增加圖像的清晰度。陳文靜[59]提出了一種基于導向濾波的 Retinex 算法,在進行水下圖像濾波的同時,有效保留了圖像的邊緣信息。Chen等人[60]提出了一種新的水下大壩裂縫圖像檢測算法,該算法將2D的裂縫圖像按像素強度(Pixel Intensity)轉換為3D 的空間曲面,通過分析曲率特征來檢測水下大壩裂縫圖像。這些算法雖然在一定程度上改善了水下大壩裂縫圖像的檢測效果,但準確度仍然有待提高。

圖像增強結合形態學方法是處理水下大壩裂縫圖像分割問題的最常用方法之一,但這種方法的分割性能受圖像增強效果的影響較大,且自適應性較差。因此,本書通過深度學習方法實現水下大壩裂縫圖像分割,以提升算法的自適應性和分割精度。目前,開源的水下大壩裂縫圖像數據集很少,而深度學習對數據集的要求很高,數據集不充足很可能導致模型訓練不充分,最終導致水下大壩裂縫圖像分割效果較差。因此,使用深度學習方法處理水下大壩裂縫圖像分割任務,需要考慮樣本不足的問題。

由于直接使用有監督學習方法處理各類學習任務常常會面臨數據樣本不充分的問題,所以研究人員提出了一些解決方案,例如半監督學習、小樣本學習和遷移學習等。半監督學習[61]通過提取并學習具有相同分布的有標簽數據和無標簽數據的特征,可以在降低對樣本標簽數量需求的同時,保證模型的性能。小樣本學習[62]通過將預訓練模型在少量的帶有標簽的目標域數據上做進一步訓練,可實現對目標域上特定任務的學習。遷移學習[63]是一種應用較為寬泛的學習方法,該方法將模型在源域上進行預訓練時學習到的先驗知識應用到目標域的學習任務中,可以有效縮短訓練時長,并保證模型的精度。相較于半監督學習,遷移學習的優勢是有標簽的源域數據和無標簽的目標域數據的分布可以不一致。遷移學習經過多年發展,已經衍生出多個分支。深度遷移學習在圖像目標分類[64]、語義分割[65]等多個領域取得了令人滿意的結果。

主站蜘蛛池模板: 罗定市| 兴化市| 洪湖市| 浙江省| 宁德市| 元谋县| 乌海市| 师宗县| 同心县| 石嘴山市| 文昌市| 于田县| 日照市| 肥西县| 达拉特旗| 利川市| 枝江市| 和顺县| 循化| 沙田区| 吴桥县| 台南市| 成武县| 平和县| 平罗县| 太原市| 科尔| 威海市| 南漳县| 苍溪县| 贵德县| 临泉县| 邓州市| 绩溪县| 福泉市| 绥阳县| 清水河县| 唐河县| 金溪县| 太湖县| 区。|