- 偏微分與變分技術在圖像分割中的應用研究
- 李鋼
- 10804字
- 2021-09-24 17:33:24
1.2 國內外研究現狀
1.2.1 圖像分割的傳統方法綜述
圖像分割的廣泛應用,促使眾多學者不斷致力于圖像分割理論和技術的研究,提出了基于不同理論的各種分割算法。信息技術在21世紀的發展日新月異,基礎學科在創新中不斷發展,同時跨學科理論被不斷引入圖像分割領域,圖像分割技術也發展出了多個分支方向。圖像分割的方法大致可以分為7種類型:基于閾值、基于邊緣檢測、基于區域、基于聚類、基于圖論、基于能量泛函、基于卷積神經網絡。
1.基于閾值的圖像分割方法
基于閾值的圖像分割方法是一種最常用的分割技術,其原理主要是利用圖像中目標和背景在灰度特性上的差異,選取一個或多個比較合適的閾值,從而達到分割出特定目標的目的。根據現有的研究,閾值法主要可以分為全局閾值法[22]和局部閾值法[23]。全局閾值法的閾值是根據全局信息產生,在整幅圖像中將灰度閾值的值設置為常數,將圖像中像素點的灰度值與閾值相比較,以此來確定該像素點是前景還是背景,通常也叫作單閾值分割。局部閾值分割是指利用圖像的局部信息,將整幅圖像分為若干個子圖像,再對每個子圖像選取合適的閾值,以實現對圖像的局部分割,所以也叫作多閾值分割。
閾值法的分割結果在很大程度上依賴于閾值的選取。針對這個問題,研究者們提出了多種閾值判定方法。Otsu等人[24]利用類間方差作為判別準則,適用范圍廣,并得到了廣泛應用,其閾值的選取依據為使得背景和目標之間的類間方差最大,目標(或背景)的類內方差最小。該方法僅對類間方差為單峰的圖像能夠得到較好的分割效果,但是當圖像中目標與背景大小比例懸殊,類間方差呈現雙峰和多峰時,分割效果不會很好,且該方法對噪聲比較敏感。此外,信息熵也被應用到閾值分割[25-29], Kapur等人[26]提出了最大Shannon熵閾值法,通過分析圖像灰度直方圖的熵,使圖像中目標與背景分布的信息量最大,找到最佳閾值。這種方法一般不需要先驗知識,而且對于直方圖的雙峰分布不均勻的圖像也可以進行很好的分割。然而,由于該方法使用窮舉法求解,在處理多閾值問題時運算速度太慢,從而難以滿足應用要求。
基于閾值的圖像分割方法從數學角度看比較簡單,可以分割灰度差異明顯的簡單圖像,這種方法在對像素比較的同時進行分類,可以獲得較高的分割效率,但其只考慮像素自身的灰度信息,忽略了圖像的語義空間特征。近年來,加入像素點與鄰域的圖像空間相關的算法被相繼提出[30-32],提高了算法的抗噪性能。
2.基于邊緣檢測的圖像分割方法
一幅圖像的不同目標區域或者目標和背景總是呈現灰度的顯著不連續性,基于邊緣檢測的圖像分割方法正是利用圖像這種灰度不連續的特點來檢測區域(或目標)的邊緣點,再按照一定策略進行連接而形成封閉的輪廓,從而實現圖像分割。該方法通常是通過檢測圖像灰度特征的突變來實現的,這種突變性的檢測可以使用不同階的梯度算子來完成。常用的邊緣檢測算子有:Sobel算子[33]、Roberts算子、LoG算子[34]和Canny算子[35]等。其中,LoG算子和Canny算子都是先對圖像進行高斯平滑,再通過計算其一階微分算子或二階微分算子來求解圖像梯度的極大值。遇到目標區域與背景的對比度明顯且受噪聲干擾較小的圖像時,這類方法會展現出良好的分割能力;當圖像的目標和背景灰度變化不是很明顯時,這類方法不但不能保證生成連續、封閉的區域輪廓,而且會存在大量的細碎邊緣,帶來很多分割噪聲點,即使進行后處理,一般也得不到理想的效果。
由此可見,由于圖像的復雜性和特異性,單純的基于邊緣的方法并不能獲得令人滿意的分割效果。目前,研究人員一般將這種方法作為前置處理環節,與其他方法融合使用。為了提高邊緣檢測法對噪聲的魯棒性,Grossmann[36]利用小波的多尺度思想來進行邊緣檢測,并取得了重大突破。Elder[37]通過逐點選擇濾波尺度,采用控制局部尺度的思想,將濾波和微分算子結合,能夠較好地對邊緣進行定位和提取,這種方法在過濾噪聲的同時盡可能地保存了目標邊界。隨后研究人員提出了很多針對具體領域的基于邊緣檢測的圖像分割方法[38-41]。
3.基于區域的圖像分割方法
基于區域的圖像分割方法的思想是先將圖像按照某些規則分成不同的區域塊,然后根據既定相似性準則(關于灰度、紋理等),對具有相同特征的區域進行合并,對具有不同特征的區域進行分裂,直至形成若干穩定的區域圖像。區域生長法和區域分裂合并法是兩種典型的區域分割方法[42-44]。區域生長法[45][46]是從單像素出發,其基本思想是從初始區域開始,選擇一個像素作為種子,將其相鄰的具有相同特性的像素(或區域)與種子所在的區域進行合并,并將合并后的新區域作為種子進行迭代、更新與合并,重復這一過程,直至滿足準則的像素點都被合并進來,停止生長,實現目標分割。該方法有兩個關鍵點:一個是初始種子點的選取,不同的種子會有不同的分割結果;另一個是生長模式的制定,生長規則直接影響分割結果,有效的生長模式可以獲得較為滿意的分割效果。該方法的算法實現簡單,時間復雜度低,但其種子點的選取需要人機交互,同時對噪聲的魯棒性也不強。區域分裂合并法的基本思想是從整幅圖像開始分裂,得到各個區域,再將相鄰的具有相似性的區域合并,最后實現目標分割。該算法排除了人工選擇種子點的干擾,但也存在有時分裂會破壞區域的邊界,分割效果較差的缺陷。
基于區域的圖像分割方法可以直接獲得目標的封閉邊界曲線,比基于邊緣的方法更加直觀。通常,在沒有先驗知識的情況下,只要給出相似性準則,基于區域的圖像分割方法就能獲得較為理想的分割效果。
4.基于聚類的圖像分割方法
基于聚類的圖像分割算法的主要思想是:將滿足一定的相似性準則的像素點收集起來,以達到分類的目的,盡可能使同一類中的像素點具有相同的特征,而不同類的像素點其特征各異。K均值聚類算法[47]、模糊C均值聚類算法[48]和均值漂移算法[49][50]都是此類算法的典型應用。K均值聚類算法的基本思想是:在所要分割的圖像區域中隨機選擇K個點作為初始的聚類中心,依據像素與聚類中心的相似距離將像素進行歸類,通過迭代的方法,逐次更新各聚類中心的值,直到收斂。K均值聚類算法將待處理的某個數據對象嚴格地歸屬于某個類。然而,在圖像處理中,許多信息并沒有嚴格的屬性。隨后,Dunn提出以模糊C均值聚類算法為代表的軟劃分概念的聚類方法[51],該方法在聚類過程中通過計算隸屬度來衡量各像素與聚類中心的距離,不對像素進行直接歸類,其分割效果較K均值聚類算法更優。此后,基于模糊理論的聚類方法得到了極大的發展,并廣泛應用于圖像分割[52]。Bezdek[53]將Dunn提出的算法進一步推廣,討論了模糊C均值聚類算法與K均值聚類算法的關系,并建立了模糊聚類理論,證明了該算法的收斂性。Wang等人[54]提出了一種模糊聚類算法,該方法利用核函數作為測度并對灰度進行變換,轉換到更高維的空間,在新的高維空間中進行聚類,將其應用于圖像分割,并取得了較好的效果。此外,研究人員還將小波變換、遺傳算法和馬爾可夫隨機場等與模糊C均值聚類算法進行融合,提出了許多改進方法[55-60],分割性能更好,分割效果更優?;诰垲惖膱D像分割方法能對大型數據進行高效分類,并得到了廣泛應用。但是,由于需要設定類的數目,且較少考慮數據間的聯系,因此基于聚類的圖像分割方法具有一定的局限性。
5.基于圖論的圖像分割方法
基于圖論對圖像進行分割是研究領域的新方向、新熱點,其基本思想是:將一幅圖像映射成一幅加權的圖,圖的節點集由圖像的像素映射,圖的邊集由像素間的關系映射,邊上的權重集由相鄰的像素間的相似度或者差異性映射。分割原理依據圖論中的成熟理論,分割的過程其實是一個尋優的過程。20世紀80年代,Greig等人[61]將GraphCuts理論引入圖像處理領域,但沒帶來太大的影響。隨后,Boykov等人[62]將圖論首次應用到圖像分割領域,這種方法將特殊模型和上下文信息相結合,被廣泛應用于解決計算機視覺中的標記問題。在2004年,Boykov等人[63]將以上算法進行改進,提出了基于增廣路徑最大流最小割算法,增加了兩條增廣路徑并改進了其算法,邊搜索邊標記,當所有的點被搜索并且標記后,最小割就形成了路徑,該方法可行性高、運行速度快,但是不適合較短的增廣路。Blake等人[64]將高斯混合模型應用于圖像的分割方法,對前景和背景的顏色空間進行高斯建模,用可進化的迭代算法取代一次最小估計來完成能量的最小化,在一定程度上影響了該分割算法的效率。Tang等人[65]在能量函數中加入了新的距離項來表示相鄰像素之間的相似性,改進了網絡圖的結構,從而提升了求解的效率,并能提高分割的質量?;趫D論的圖像分割方法在后續還發展出了許多結合遺傳算法、神經網絡、活動輪廓模型的新方法,是圖像分割領域的一個研究熱點。近年來,基于圖論的圖像分割技術獲得了比較廣泛的關注和研究,取得了很多不錯的成績[66]。
6.基于能量泛函的圖像分割方法
近年來,基于能量泛函的圖像分割方法是典型的模型驅動方法,因其具有良好的數學可塑性而被國內外研究人員作為研究的熱點[67-69],該方法在目標分割過程中不斷尋找先驗信息匹配圖像特征,是一種融合了先驗信息的分割模型。能量泛函的極小化問題是基于偏微分技術的圖像分割方法的基本問題,先定義一個閉合曲線及其能量函數,用變分法最小化該能量泛函,在最小化的過程中形成向目標區域運動的驅動力,該驅動力由輪廓曲線演化的自身內力和圖像數據蘊含的拉升外力共同構成,驅動輪廓向目標邊界移動,直到能量達到極小值,圖像的輪廓曲線到達目標邊界,分割結束。相對于傳統的圖像分割方法,基于變分理論的圖像分割方法可以提取連續、封閉的目標輪廓,并且結合了很多先驗知識,提高了輪廓提取的可靠性和準確性,在邊緣檢測、噪聲圖像分割以及運動跟蹤中已經得到了廣泛應用并取得了很大的發展。同時,這種方法具備良好的人機交互能力,各領域學者可以在具體的工作領域對分割過程和結果進行專家干預,從而獲得更真實的分割結果,改善了分析結果數據。在近十幾年中,研究者們成功地將其應用于各個行業的細分領域,與該方法相關的研究工作取得了眾多有價值的研究成果,已然成為計算機視覺和模式識別的熱點領域。
7.基于卷積神經網絡的圖像分割方法
近年來,深度學習技術和卷積神經網絡在圖像分類、目標檢測和圖像分割等經典圖像問題上取得很大發展。該類方法使用深度學習技術訓練卷積神經網絡以有效提取特征圖,將待分割圖像轉換為易于處理的特征圖像,進行像素級分類,實現對待分割圖像與期望分割結果間的映射關系的擬合。該類方法具有學習能力,可有效擬合自然圖像與對應分割真值(Ground Truth)間的函數關系,可處理復雜的自然圖像分割問題與多目標分割問題,對光照不均勻、陰影等干擾因素有著非常出色的魯棒性,甚至實現了圖像語義理解和實例分割。但深度學習方法對標注數據量的要求與分割任務難度正相關,且運算量極大,通常需要海量數據才能準確分割自然圖像。在不使用數據擴增技術及其他模型訓練技巧的前提下,Mask R-CNN等基于大型卷積神經網絡的現代深度學習圖像分割方法難以在小規模數據集上得到有效訓練,難以滿足分割實時性的要求。
1.2.2 基于偏微分方程圖像的分割方法綜述
近年來,基于偏微分方程的方法作為圖像處理領域的一個重要分支,以其出色的表現吸引了越來越多的研究者,得到了迅速發展,逐漸成為圖像處理領域的研究熱點。用偏微分方程進行圖像處理的基本思想是:將所要研究的問題歸結為一個泛函極值問題(帶約束條件或不帶約束條件的),再利用變分法導出一個(或一組)偏微分方程(需要初始條件或邊界條件),用數值計算方法求解此偏微分方程(或方程組),最后求得的解是一幅圖像(圖像復原或圖像增強),或是圖像及其邊界(圖像分割)。
隨著計算機技術的發展和人類對圖像本質的理解不斷深入,基于偏微分方程的圖像處理也獲得漸進有序的發展,這方面的研究工作最早可以追溯到Keonderink[70]對于圖像結構的探索以及Nagao[71]、Rudin[72]等人關于圖像光滑和圖像增強的研究。用偏微分方程技術進行圖像處理真正開始于Witkin[73],其引入了尺度空間(Scale Space)的理論。尺度空間把一組圖像同時在多個尺度上表述。在他們的研究工作中,圖像的多尺度表示是通過高斯濾波來完成的(等價于利用經典的熱傳導方程來演化圖像),這個理論成為偏微分方程在圖像處理應用領域的基礎。20世紀80年代末,Hummel[74]在這個基礎上提出了熱傳導方程并不是唯一可以構成尺度空間的拋物方程,并提出了構成尺度空間的準則。Perona和Maliktl[75]提出了在這個領域最具有影響力的各向異性擴散方程,用一個可以保持邊緣的有選擇性的擴散來替換高斯(Gaussian)擴散,從而實現了圖像處理過程中平滑噪聲和銳化邊緣的平衡,他們的工作引發了很多理論和實際問題的研究。隨后,在這個領域中,Osher和Rudin[76][77]提出了沖擊濾波器以及關于全變差(Total Variation, TV)模型的研究工作,更突出了偏微分方程圖像處理中的必要性和重要性。上述方法的成功之處在于,能夠將圖像視為由跳躍邊緣連接而成的分片光滑函數(曲面),從而與某種偏微分方程的分片光滑解聯系起來。
偏微分方程圖像分割技術是在20世紀80年代產生并逐漸發展起來的一種非線性分割方法[78]。利用動力學模型的思想,通過在圖像的定義域內定義一條初始曲線,再給這條曲線施加演化驅動力(驅動力由演化內力和圖像信息蘊含的外力共同構成),驅動曲線向著目標演化,從而得到目標的輪廓。偏微分方程圖像分割方法的最大優點是曲線在演化獲得目標邊界的過程中始終保持連續性和光滑性,這種內在的數學演化能力是傳統方法所無法比擬的。基于偏微分方程的圖像分割技術作為一種較新穎且有效的圖像分割方法,其鮮明的特點和有效性為傳統圖像分割技術存在的諸多困惑提供了一種嶄新的研究思路。
在這個領域最為突出的是主動輪廓模型,該方法直接用連續曲線模型來定位圖像邊緣。由于模型有嚴謹的數學理論作為支撐,因此具有高效的數值分析和計算能力,可以獲得良好的分割效果,使其成為近年來備受關注的持續的研究熱點。其原理是:設置一條帶有能量的初始閉合曲線,使其在圖像信息和給定條件的約束驅動下不斷發生演化,使曲線持續向著能量減小的方向形變。這是一種將輪廓提取和先驗知識結合在一起發生的自主運動形變,不需要用戶的交互,因此被稱為主動輪廓模型。
依據曲線的表示方式,主動輪廓模型可以分為參數主動輪廓模型和幾何主動輪廓模型。
1.參數主動輪廓模型
由Kass等人[79]提出的Snake模型是一個經典的參數主動輪廓模型(parametric active contour model),也稱Snake模型。該模型提出了一個整體性分割框架,將圖像信息、目標特征、先驗知識和初始輪廓都集中到一起進行考慮,將提取目標邊界的問題轉化為一個求解能量泛函極小值的問題。盡管該模型是圖像分割方法的一個重大突破,但是它仍存在一些缺陷:對演化曲線的初始位置敏感;能量泛函具有非凸性,曲線在演化過程中容易陷入局部極小導致分割失?。磺€的拓撲結構發生的突變無法自動進行處理;計算時空復雜度高;等等。
研究者們提出了各種相關的改進模型,以解決Snake模型存在的缺陷。Cohen等人[80]在Snake模型的基礎上增加了一項氣球力,增強了模型的外力力度,進而擴大了捕捉范圍,降低了曲線對初始輪廓位置的依賴性,但該模型容易導致邊界泄漏且受參數設置的影響較大。Xu和Prince提出了梯度向量流(Gradient Vector Flow, GVF)[81]和廣義梯度向量流(Generalized GVF)Snakes模型[82],該模型擴大了輪廓的形變范圍,能夠有效地收斂到凹陷很深的區域,在一定程度上減弱了對初始輪廓的依賴性,但容易受到偽目標的干擾導致分割失敗。Williams等人[83]將貪心算法(Greedy Algorithm)引入活動輪廓模型中,加快了曲線迭代的速度,但是容易陷入局部極小。另外,Li等人[84]提出了向量場卷積(Vector Field Convolution)模型,解決了輪廓的自動初始化問題和曲線在演化過程中的分裂問題。Hafiane等人[85]通過相位分析對GVF提供可靠的邊緣,利用概率模型增大目標區域的似然能量項,產生了一個新的外力場,提高了抗噪聲能力,改進了分割過程。
盡管研究者們針對參數主動輪廓模型提出了很多改進算法,但是依然存在很多固有的問題,這些模型的閉合曲線是由曲線的參數形式來描述的,在演化過程中,曲線的內在參數(如法向矢量和曲率等)的計算復雜度較高,也無法處理曲線的拓撲變化,這就為基于幾何主動輪廓模型的提出創造了條件。
2.幾何主動輪廓模型
近年來,水平集方法和曲線演化理論被廣泛應用于圖像分割。Caselles等人[86]和Malladi等人[87]提出了基于幾何特征的幾何主動輪廓模型,這類模型利用圖像的邊緣梯度信息和曲線的平均曲率來構造水平集的速度函數,很好地克服了演化曲線的拓撲結構變化問題。其基本思想是:通過一個高維函數曲面來表達低維的演化曲線(或曲面),即將演化的曲線(或曲面)表達為高維函數曲面的零水平集的間接表達形式,將演化曲線(或曲面)的演化方程轉化為高維水平集函數的演化偏微分方程,避免了變形曲線(或曲面)的參數化過程和時刻對曲線演化過程的跟蹤,從而能夠適應曲線拓撲形狀的變化。
幾何主動輪廓模型可以簡單分為兩類[88]:一類是基于邊緣的幾何主動輪廓模型;另一類是基于區域的幾何主動輪廓模型?;谶吘壍哪P褪侵笇D像的梯度信息引入模型,驅動曲線向著目標邊界演化?;趨^域的模型是利用圖像的區域信息,抽取區域特征進而分區,完成目標提取。相較于基于邊緣的模型,基于區域的模型在分割邊界特征模糊的圖像時展現出良好的分割效果。
測地線主動輪廓(Geodesic Active Contour, GAC)模型[89]是基于邊緣的代表方法之一,其原理就是將目標輪廓的提取問題轉化為尋找一條最短測地線的問題。GAC模型在一定程度上改善了弱邊緣帶來的邊界泄漏問題,但其存在一個明顯的缺陷,即演化曲線只能向一個方向運動,初始輪廓線的位置選取對分割結果的影響非常敏感。為了解決此類問題,國內外學者提出了很多算法來改善分割效果,基于區域的圖像分割方法逐漸被研究并提出。Zhu等人[90]將區域競爭的思想、主動輪廓線模型和貝葉斯準則結合起來,提高了對區域統計估計的正確性,從而提高分割精度,并將區域分割模型和主動輪廓線模型結合在一起,提出了測地主動區域輪廓模型。Mumford和Shah提出的MS模型[91]是經典的基于區域的主動輪廓模型,其認為分割后的圖像與原圖像之間的誤差比所有使用其他邊界分割得到的圖像差值都小,進而獲得更好的分割結果。此方法由于考慮了圖像區域的統計信息,其分割結果與初始曲線的位置無關,對圖像中的弱邊緣或灰度間斷等問題有較好的魯棒性,但是其計算過程比較復雜,運行效率不高,導致模型的進一步發展受限,實際應用不多。為了解決這個問題,Chan和Vese[92]以MS模型為基礎,提出了著名的CV(Chan-Vese)模型,該模型是MS模型的簡化形式,即假設待分割的圖像的目標和背景分別是由兩個光滑的不同的灰度值構成的區域,近似輪廓內外的圖像,可以更好地擬合圖像。為了保證數值求解的有效性和穩定性,CV模型在實際演化過程中為了保持符號距離函數的性質,需不斷重新初始化水平集函數。此外,CV模型利用的是圖像的全局信息,有效規避了灰度的分布均勻性問題,對于灰度均勻的圖像呈現出良好的分割效果,但對于灰度不均勻(intensity inhomogeneity)的圖像的分割不夠理想。近年來,許多學者從不同角度對CV模型進行了擴展或改進。
CV模型是基于水平集來進行圖像分割的,而水平集方法由于其自身的數學特性,在演化的過程中,水平集函數會發生震蕩而變得不再光滑,逐步失去符號距離函數的特性,慢慢造成誤差的累積,從而導致計算結果偏離真實情況,是不可避免的[93][94]。為此,有學者提出重新初始化的方法對函數的光滑性和符號距離函數進行修正,但是這種方法在提高精度的情況下犧牲了時間效率。為了解決水平集函數的初始化問題,針對其初始化問題的算法大量涌現,目前應用得最廣泛的是Li等人[98][99]提出的一種變分水平集方法,其在原模型的能量泛函的基礎上加入一個懲罰項,從而使水平集函數在演化的同時保證了對符號距離函數的近似,無須對函數進行重新初始化,也提高了算法的數值精度。Zhang等人[95]在算法迭代的過程中利用高斯濾波的方式來代替對水平集函數進行重新初始化的方法,使函數在演化過程中的光滑特性得到增強,從而降低數值計算的不穩定性。
CV模型對低對比度和灰度不均勻圖像無法獲得理想的分割結果,為此學者們提出了很多方法,其中改進的分段常量模型的方法,即分段光滑模型備受關注,Chan等人[96]對此模型進行拓展,將多個區域通過多個水平集函數表示,提出了分片光滑(Piecewise Constant, PC)函數模型。然而,由于這些算法都以區域內的平均灰度值作為測度,平均值顯然丟失了灰度的分布信息,CV模型和PC模型都存在天然的缺陷,即無法有效區分灰度的分布屬性,對灰度不均勻圖像的分割效果較差。為了很好地解決這個問題,Tsai[96]和Vese[97]等人分別提出了兩個相似的分段光滑(Piecewise Smooth, PS)函數模型,用分片光滑的函數逼近真實圖像,從而代替CV模型中的分片常數,該模型在一定程度上消除了灰度的分布信息,可以分割灰度不均勻圖像,并能實現復雜拓撲結構的分割。但是,PS模型在算法實現的過程中,每隔一定的迭代次數,便要計算兩個偏微分方程,因此整個模型的計算量比較大,從而限制了該模型的應用。
上述模型都是基于全局信息,Li等人[98][99]針對CV模型丟失了圖像的灰度分布信息和PS模型計算時間復雜度大等缺點,提出了局部二值擬合(Local Binary Fitting, LBF)模型,這種方法使用高斯核函數來提取圖像局部灰度分布信息,可以較好地解決前述模型無法分割灰度不均勻圖像的問題,但是這種模型對于圖像噪聲和初始位置敏感性極高,容易引起局部極小。Zhang等人[95]提出了局部圖像擬合(Local Image Fitting, LIF)能量模型,可以看作擬合圖像與原始圖像差異的約束條件,該算法與LBF分割準確度相似,但加快了分割速度。Wang等人[100]提出了局部高斯分布擬合模型,將圖像的局部灰度分布使用不同均值和方差的高斯分布來描述,對噪聲和灰度的不均勻性表現出良好的魯棒性,還可以區分灰度均值相似但方差不同的紋理區域,但計算時間較長。Zhang等人[101]用圖像的全局信息構造符號壓力函數,代替GAC模型中的邊緣停止函數,提高了抗噪的能力。Wang等人[102]將局部信息引入CV模型,提出了基于局部信息的CV改良模型(LCV),同時利用圖像的全局與局部信息構造出演化曲線的驅動力。該模型具有計算復雜度較低和對初始輪廓不敏感的優勢。Li等人[103]提出了一個基于局部聚類圖像擬合(Local Clustering Image Fitting, LCIF)模型,用于對醫學圖像進行分割和偏移校正,算法在迭代過程中交替對偏移場和水平集函數進行計算。該算法能夠對較高程度的灰度不均勻圖像和醫學圖像進行有效分割,且取得了較好的分割結果。He等人[104]將熵的概念和LBF模型結合在一起,提出了基于局部熵的圖像分割模型,將局部灰度熵作為權值加入能量積分函數,提高了對同質區域的分割能力,增強了模型對初始輪廓和強噪聲的魯棒性。Li等人[105]提出了基于局部二值擬合和統計信息的水平集圖像分割模型,在分割精度和噪聲魯棒性方面得到較大的提高。Yuan等人[106]提出了一種融合模型,這種模型使用圖像局部灰度統計信息和局部梯度信息共同構造曲線演化驅動力,局部均值的能量項在目標邊界附近起主要作用,而局部梯度能量項能在遠離目標真實邊界的地方驅使輪廓曲線迅速變化,得到最終的能量泛函,提高了分割的準確性和穩定性。Wang等人[107]使用局部相關性系數判別正常像素點與噪聲點,提出了局部的相關熵K均值算法。Huang等人[108]提出了一種基于局部統計信息和全局相關熵度量的圖像分割方法,可以更好地解決圖像中的噪聲點、孤立點等引起分割失敗的問題。廖祥云等人[109]提出了引入局部全局信息的區域自適應快速活動輪廓模型,并根據灰度分布情況動態調節局部區域的半徑大小,提高了模型分割準確度,但是該算法在調節局域半徑時引入過多的參數,在實現過程中需要進行大量的調試工作,同時分割精度還有待提高。Niu等人[110]提出了一種基于局部相似性系數(Local Similarity Factor)的能量擬合模型RLSF,該模型考慮了鄰域內每個像素點與鄰域中心的歐氏距離代替RSF模型的高斯核函數,有效平衡了像素點與所在鄰域平均灰度的差異,更好地克服了灰度不均勻對分割的影響。近年來,國內外學者對基于圖像的局部灰度特征方法進行了大量研究,提出了很多模型,可以參考文獻[111-124]。
多目標輪廓提取也是圖像分割的一項重要研究內容,CV模型將圖像定義為前景(目標)和背景,正是由于這種假定的二值屬性,模型天然地無法對含有多個目標的圖像有效分割。同時,參數主動輪廓模型由于其參數化的性質,通常只具備單目標區域輪廓的提取能力,圖像中不同的目標區域通常被不同的封閉曲線所圍,互不重疊,因此將所有封閉曲線所圍區域的目標特性進行統一處理是不合適的。而幾何主動輪廓模型對參數采用一種非參數的表述,能夠利用水平集自動處理拓撲變化的能力,從而使零水平集函數所代表的輪廓線能夠正確地分裂,實現多目標輪廓的提取。正因為如此,幾何主動輪廓模型一般被用于含有多個分割目標的分割模型。單個水平集函數在通常情況下只可以描述兩相圖像,而多相圖像通常用多個水平集函數來描述。多相分割開始于Zhao等人[125]對該問題進行研究之后,他們提出了用N個函數劃分N個不同的圖像區域,并附加相應的約束條件,避免了水平集函數的重疊覆蓋,同時也可避免其遺漏覆蓋。隨后,Samson等人[126]對其進行深入研究,該模型用于對分段圖像的分類。Vese[177]在后來的幾年中對其不斷改進,減少了分割水平集的個數,用N個水平集函數來表達2N個圖像區域。但是分目標的數量和計算數據的存儲量基本成線性關系,并且受到多個水平集函數相互間的影響,隨著分割目標的增加,算法的時間復雜度和空間復雜度也顯著增加。Tsai等人[97]提出了使用層級單水平集函數的方式來解決這個問題,但效果并不明顯。Brox等人[127]在區域競爭模型的基礎上,創建了多步分裂合并方案,首先利用單水平集函數來對整個區域進行預分割,接著對其進行第二次分割,將兩次分割后相仿的區域進行合并。兩年之后,Mansouri等人[128]使用最小化的貝葉斯估計得到了所有目標輪廓線的耦合演化方程,然后代入標準的水平集演化方程,不同的目標區域獲得了不同的水平集函數。對于多相圖像分割的研究雖取得了一定成績,但還是存在很多問題,如多個水平集函數的設置、區域的劃分方法、分割區域數量的自動確定等。
由于CV模型的能量泛函具有非凸性,能量泛函在取極小值時,得到的可能是局部極小,而不是全局極小值,這種情況可能導致水平集的不同的初始條件(大小和位置),會得到完全不同的分割結果,圖像分割的結果過于依賴初始條件,有的不是預期的理想的分割結果,而有的是完全錯誤的分割結果。針對這些問題,Chan等人[129]對建立在L1空間的圖像分割總變分(Total Variation, TV)模型[130]進行了深入分析,給出了解存在的唯一性條件。隨后他們公布了一種求解全局極小值的算法[131],這種方法可以對模型中能量泛函的非凸屬性進行轉化,獲得凸的能量泛函,再通過極小化該能量泛函來求解全局極小值。Bresson等人[132]提出了一種等效的全局凸分割模型,該方法借助松弛的水平集函數的Heaviside函數,可以將原局部優化問題轉化為全局優化問題,降低了分割結果對初始輪廓線的敏感性。Goldstein等人[133]則將分裂(Split)方法和Bregman迭代相結合,提出了Split Bregman方法,該方法在分裂迭代的同時具有較高的計算效率,而且在算法上也易于實現,但是此算法最初用來解決圖像的擴散問題。后來,Goldstein等人[134]將Split Bregman迭代算法應用到圖像分割領域中,用于求解全局凸優化模型。Lee等人[135]提出了一個具有全局極小解的基于水平集方法圖像分割模型,該模型引入一個位移Heaviside函數,以此來避免水平集函數陷入局部極小,使得分割結果可以不依賴初始曲線位置的選擇。