官术网_书友最值得收藏!

第1章 緒論

1.1 研究背景和意義

視覺使人類得以感知和理解周邊的世界,而圖像則因其直觀、表現(xiàn)內(nèi)容豐富等特點,被視為傳遞信息最理想的載體之一[1]。據(jù)統(tǒng)計,在人類接受的信息中,圖像等視覺信息所占的比例達到75%。隨著現(xiàn)代物理學、成像技術、計算機技術、通信技術的發(fā)展,模擬圖像逐漸被分辨率更高的數(shù)字圖像取代。數(shù)字圖像是由模擬圖像在連續(xù)空間進行離散化得到的、以像素為基本元素的、可以用數(shù)字計算機或數(shù)字電路存儲的圖像數(shù)據(jù)。為了改善圖像的視覺效果并提高圖像的實用性,一般利用計算機技術或其他數(shù)字技術對圖像信息進行某些數(shù)學運算和各種加工處理,這個過程稱為數(shù)字圖像處理[2]。數(shù)字圖像處理起源于20世紀20年代,隨著計算機在20世紀50年代的進一步發(fā)展,研究人員逐漸認識到數(shù)字圖像處理的重要性,對此進行系統(tǒng)的分析和研究工作就此展開。20世紀60年代初期,數(shù)字圖像處理已經(jīng)作為一門獨立的學科開始發(fā)展;20世紀后期,隨著數(shù)字技術和微電子技術的迅猛發(fā)展,很多先進的圖像處理方法和設備陸續(xù)出現(xiàn),數(shù)字圖像處理因其日益廣泛的應用而逐漸從信息處理、自動控制系統(tǒng)論、電視技術、數(shù)據(jù)通信等學科中分離,形成了以“圖像信息的獲取、儲存、傳輸、變換、顯示、分析、理解與綜合應用”為場景的嶄新學科[3]

圖像處理主要研究的內(nèi)容有圖像變換、圖像壓縮編碼[4][5]、圖像增強[6][7]和復原、圖像分割[8]、圖像識別[9]、圖像分析和理解。圖像處理系統(tǒng)的基本構成如圖1-1所示,將圖像進行適當?shù)募庸ず吞幚砗螅梢赃M一步優(yōu)化和提升視覺效果,提高視覺質(zhì)量。處理后的圖像變得更加規(guī)范、有序,更容易被計算機提取某些特征來進行分析、處理和識別。

圖1-1 圖像處理系統(tǒng)的基本構成

從圖1-1中可以看出,圖像分割是圖像處理中最基本、最關鍵的步驟之一,它為圖像的進一步處理(識別、理解等)提供了基礎判別數(shù)據(jù),它是聯(lián)系低層次的圖像處理和高層次的圖像視覺理解的橋梁。圖像分割是后續(xù)的目標檢測、目標識別、對象追蹤等圖像理解領域的基礎課題,分割中產(chǎn)生的誤差會向上傳遞到高層次的圖像分析與理解階段,因此圖像分割的準確與否直接影響后續(xù)圖像處理應用層的精確性與有效性[10]

在圖像的分析處理中,人們常常將圖像分為前景(目標)和背景。前景是指研究人員感興趣的具有特定特征或性質(zhì)的連續(xù)區(qū)域,前景之外的部分稱為背景。圖像分割所要研究和解決的問題就是如何將圖像中感興趣的前景區(qū)域和背景準確分離,進而為后續(xù)的圖像分析和理解提供基礎。從廣義上講,圖像分割是指按照某種特殊屬性將圖像分成不同的區(qū)域,這里的特性可以是像素的灰度、顏色、紋理等,每一個區(qū)域都滿足特定區(qū)域的一致性,互不交叉。從形式化的角度講,借助于集合概念,圖像分割的定義如下[11]

將整個圖像區(qū)域I劃分為N個滿足下列條件的非空子集(子區(qū)域)I1, I2, …, IN

(1)∪Ni=1Ii=1;

(2)對于i, j∈[1, N],且ij, IiIj=?;

(3)對于i∈[1, N],有PIi)=TRUE;

(4)對于i, j∈[1, N]且ij,有PIiIj)=FALSE;

(5)對于i∈[1, N], Ii為連通區(qū)域。

即所有子區(qū)域的并集為整個圖像區(qū)域I,任意兩個不同的子區(qū)域的交集為空,子區(qū)域不重疊。PIi)是對所有在集合Ii中元素的邏輯謂詞。

圖像分割算法在圖像處理中占有重要地位,從而吸引了很多研究人員的關注,并在近幾十年得到了快速發(fā)展,各種優(yōu)秀的算法被相繼提出,每年有大量研究成果和論文涌現(xiàn)。但是,這些算法都是針對某一類具體的研究對象而產(chǎn)生的,至今仍存在分割算法的通用性差、分割精度不高和計算效率低等問題。造成這一現(xiàn)象的原因主要有以下兩點:

(1)圖像分割問題的解不具有唯一性,一幅圖像中包含邊緣、形狀、色彩和紋理等各種不同的特征,而這些特征難以用統(tǒng)一的方法來表示,因而在實際應用中只能根據(jù)不同主體和不同任務的需求來選擇合適的分割方法。

(2)由于圖像數(shù)據(jù)的多樣性和復雜性(例如,醫(yī)學圖像具有低對比度和高噪聲等特征,紅外船舶圖像的背景比較復雜等),圖像的結構性質(zhì)呈現(xiàn)迥然相異、各不相同的特性,因此圖像分割的難點之一就是尋找圖像、圖像前景和背景的深層次的本質(zhì)特征,建立相關模型。

目前,圖像分割在智能交通[12]、生物醫(yī)學圖像處理[13-16]、工業(yè)自動化生產(chǎn)[17]、遙感衛(wèi)星圖像處理[18]、視頻圖像處理[19][20]、安全監(jiān)控以及軍事[21]等領域都得到了廣泛應用。例如,在生物醫(yī)學領域,通過提取圖像中器官組織的結構區(qū)域,可以為醫(yī)生分析器官體的數(shù)據(jù)信息、組織結構細胞的識別等方面提供幫助;在智能交通領域,將視頻序列中的目標車輛從背景中提取出來,有助于定位和識別車牌;在遙感圖像領域,利用遙感數(shù)據(jù)進行海洋監(jiān)測和海洋污染監(jiān)控時,需要通過圖像分割來提取圖像中的海岸線;在軍事領域,可以通過圖像分割為目標的自動識別提供參數(shù),等等。圖1-2(書后附彩插)所示為圖像分割的應用場景。可以說,在所有圖像處理過程中,只要涉及對圖像目標的提取、測量和分析,就離不開圖像分割。

圖1-2 圖像分割的應用實例

主站蜘蛛池模板: 抚州市| 论坛| 迁安市| 竹北市| 温宿县| 三原县| 南城县| 土默特左旗| 新化县| 汪清县| 翁源县| 墨竹工卡县| 英德市| 拉孜县| 夏邑县| 安多县| 堆龙德庆县| 渑池县| 堆龙德庆县| 邮箱| 景泰县| 岗巴县| 隆子县| 武威市| 沙坪坝区| 元江| 尉犁县| 三亚市| 喜德县| 高雄市| 周口市| 福泉市| 株洲县| 慈溪市| 隆昌县| 集贤县| 都昌县| 隆子县| 克山县| 重庆市| 朝阳区|