3.2 基于閾值的目標提取[1]
3.2.1 二值化處理
二值化處理(binarization)是把目標物從圖像中提取出來的一種方法。二值化處理的方法有很多,最簡單的一種叫做閾值處理(thresholding),就是對于輸入圖像的各像素,當其灰度值在某設定值(稱為閾值,threshold)以上或以下,賦予對應的輸出圖像的像素為白色(255)或黑色(0)。可用式(3.1)或式(3.2)表示。
(3.1)
(3.2)
其中f(x,y)、g(x,y)分別是處理前和處理后的圖像在(x,y)處像素的灰度值,t是閾值。
根據圖像情況,有時需要提取兩個閾值之間的部分,如式(3.3)所示。這種方法稱為雙閾值二值化處理。
(3.3)
3.2.2 閾值的確定
我們知道,灰度圖像像素的最大值是255(白色),最小值是0(黑色),從0~255,共有256級,一幅圖像上每級有幾個像素,把它數出來(計算機程序可以瞬間完成),做個圖表,就是直方圖。如圖3.1所示,直方圖的橫坐標表示0~255的像素級,縱坐標表示像素的個數或者占總像素的比例。計算出直方圖,是灰度圖像目標提取的重要步驟之一。

圖3.1 直方圖
對于背景單一的圖像,一般在直方圖上有兩個峰值,一個是背景的峰值,一個是目標物的峰值。例如,圖3.2(a)是一粒水稻種子的G分量灰度圖像,圖3.2(c)是其直方圖。直方圖左側的高峰(暗處)是背景峰,像素數比較多,右側的小峰(亮處)是籽粒,像素數比較少。對這種在直方圖上具有明顯雙峰的圖像,把閾值設在雙峰之間的凹點,即可較好地提取出目標物。圖3.2(b)是將閾值設置為雙峰之間的凹點50時的二值圖像,提取效果比較好。

圖3.2 籽粒圖像及其直方圖

圖3.3 直方圖平滑化
如果原始圖像的直方圖凹凸激烈,計算機程序處理時就不好確定波谷的位置。為了比較容易地發現波谷,經常采取在直方圖上對鄰域點進行平均化處理,以減少直方圖的凹凸不平。圖3.3是圖3.2(c)經過5個鄰域點平均化后的直方圖,該直方圖就比較容易通過算法編寫來找到其波谷位置。像這樣取直方圖的波谷作為閾值的方法稱為模態法(mode method)。
在閾值確定方法中除了模態法以外,還有p參數法(p-tile method)、判別分析法(discriminant analysis method)、可變閾值法(variable thresholding)、大津法(OTSU method)等。p參數法是當物體占整個圖像的比例已知時(如p%),在直方圖上,暗灰度(或者亮灰度)一側起的累計像素數占總像素數p%的地方作為閾值的方法。判別分析法是當直方圖分成物體和背景兩部分時,通過分析兩部分的統計量來確定閾值的方法。可變閾值法在背景灰度多變的情況下使用,對圖像的不同部位設置不同的閾值。
其中,大津法在各種圖像處理中得到了廣泛的應用,下面具體介紹一下大津法。
大津法也叫最大類間方差法,是由日本學者大津(OTSU)于1979年提出的。它是按圖像的灰度特性,將圖像分成背景和目標兩部分。背景和目標之間的類間方差越大,說明構成圖像的兩部分的差別越大。因此,使類間方差最大的分割意味著錯分概率最小。
設定包含兩類區域,t為分割兩區域的閾值。由直方圖經統計可得:被t分離后的區域1和區域2占整個圖像的面積比θ1和θ2,以及整幅圖像、區域1、區域2的平均灰度μ、μ1、μ2。整幅圖像的平均灰度與區域1和區域2的平均灰度值之間的關系為:
μ=μ1θ1+μ2θ2 (3.4)
同一區域常常具有灰度相似的特性,而不同區域之間則表現為明顯的灰度差異,當被閾值t分離的兩個區域間灰度差較大時,兩個區域的平均灰度μ1、μ2與整幅圖像的平均灰度μ之差也較大,區域間的方差就是描述這種差異的有效參數,其表達式為:
(3.5)
式中,表示了圖像被閾值t分割后兩個區域間的方差。顯然,不同的t值就會得到不同的區域間方差,也就是說,區域間方差、區域1的均值、區域2的均值、區域1面積比、區域2面積比都是閾值t的函數,因此上式可以寫成:
(3.6)
經數學推導,區域間方差可表示為:
(3.7)
被分割的兩區域間方差達到最大時,被認為是兩區域的最佳分離狀態,由此確定閾值T。
(3.8)
以最大方差決定閾值不需要人為地設定其他參數,是一種自動選擇閾值的方法。但是大津法的實現比較復雜,在實際應用中,常常用簡單迭代的方法進行閾值的自動選取。其方法如下:首先選擇一個近似閾值作為估計值的初始值,然后連續不斷地改進這一估計值。比如,使用初始閾值生成子圖像,并根據子圖像的特性來選取新的閾值,再用新閾值分割圖像,這樣做的效果好于用初始閾值分割圖像的效果。閾值的改進策略是這一方法的關鍵。例如,一種方法如下:
①選擇圖像的像素均值作為初始閾值T;
②利用閾值T把圖像分割成兩組數據R1和R2;
③計算區域R1和R2的均值u1、u2;
④選擇新的閾值T=(u1+u2)/2;
⑤重復②~④步,直到u1和u2不再發生變化。
圖3.4是采用上述大津法對G分量圖像進行的二值化處理結果,對于該圖像,大津法計算獲得的分割閾值為52。

圖3.4 大津法二值化圖像