2.1 圖像和數字圖像
圖像是客觀對象的一種相似性的、生動性的描述或寫真,是人類社會活動中最常用的信息載體。或者說圖像是客觀對象的一種表示,它包含了被描述對象的有關信息。圖像在人類對外部世界的感知中起著最重要的作用,因為視覺系統是人類具備的感官系統中最高級也是最復雜的。圖像與其他的信息形式相比,具有直觀、具體、生動等諸多顯著的優點。自然界中的圖像都是模擬量,但是,計算機只能處理數字量,而不能直接處理模擬圖像,數字化后的圖像就稱為數字圖像。數字圖像擴展了人類獲取信息的渠道,可以幫人們更加客觀、準確、快速地了解世界和認識世界。
2.1.1 圖像
廣義上,圖像就是所有具有視覺效果的畫面,它包括:紙介質上的,底片或照片上的,電視、投影儀或計算機屏幕上的。我們可以按照圖像的存在形式、亮度等級和圖像的光譜這幾種形式對其進行分類。
(1)按照圖像的存在形式分類
①可見圖像 包括照片、形狀線條圖片等和透鏡、光柵等成像的光圖像。
②不可見圖像 包括紅外、微波成像的不可見光成像和溫度、壓力等按數學模型生成的圖像。
(2)按照圖像的亮度等級分類
①二值圖像 只有黑白兩種亮度等級的圖像。
②灰度圖像 有多種亮度等級的圖像。
按照圖像的亮度等級分類如圖2.1所示。

圖2.1 按照圖像的亮度等級分類
(3)按照圖像的光譜分類
①彩色圖像 每個像素由R(紅)、G(綠)、B(藍)分量構成的圖像,其中R、G、B是由不同的灰度級來描述的。
②黑白圖像 每個像素點只有一個亮度值分量,如黑白照片、黑白電視畫面。
按照圖像的光譜分類如圖2.2所示。

圖2.2 按照圖像的光譜分類
(4)按照圖像是否隨時間變換分類
①靜態圖像 不隨時間而變化的圖像,如各種圖片等。
②動態圖像 隨時間而變化的圖像,如電影和電視畫面等。
(5)按照圖像所占空間和維數分類
①二維圖像 平面圖像,如照片等。
②三維圖像 空間分布的圖像,一般使用兩個或者多個攝像頭得到。
2.1.2 數字圖像
一幅圖像可定義為一個二維函數f(x,y),其中x和y是空間坐標,而在任何一對空間坐標(x,y)處的幅值f稱為圖像在該點處的強度或灰度。當(x,y)和灰度值f是有限的離散數值時,我們稱該圖像為數字圖像。注意,一個大小為M×N的數字圖像是由M行N列的有限元素組成的,每個元素都有特定的位置和幅值,代表了其所在行列位置上的圖像物理信息,如灰度和色彩等。這些元素稱為圖像元素或像素。
每個圖像的像素在二維空間中的特定“位置”,均由一個或者多個與那個點相關的采樣值組成數值。根據這些采樣數目及特性的不同,數字圖像可以劃分為:
(1)二值圖像(Binary Image)
二值圖像的灰度值只有0、1,其中灰度值0代表黑色,1代表白色。二值圖像包含信息少,占用空間少,但是二值圖像往往能夠排除干擾,獲得對象的最突出點,如指紋圖像的識別、文字的自動識別等。
(2)灰度圖像(Gray Scale Image)
在二值圖像中進一步加入許多介于黑色與白色之間的顏色深度,就構成了灰度圖像。圖像中每個像素可以由0(黑)~255(白)的灰度值表示,每種灰度(顏色深度)稱為一個灰度級,通常用L表示。在灰度圖像中,像素可以取0~(L-1)之間的整數值,根據保存灰度數值所使用的數據類型不同,可能有256種取值或者說2k種取值。
(3)彩色圖像(Color Image)
彩色圖像是指由紅、綠、藍三種基本顏色組合而成,通常稱它們為RGB三原色。計算機顯示彩色圖像時采用最多的就是RGB模型,對于每個像素,通過控制R、G、B三原色的合成比例就可以決定該像素的最終顯示顏色。
(4)偽彩色圖像(False-Color)
偽彩色圖像的每個像素值實際上是一個索引值或代碼,該代碼值作為色彩查找表CLUT(Color Look-Up Table)中某一項的入口地址,根據該地址可查找出包含實際R、G、B的強度值。這種用查找映射的方法產生的色彩稱為偽彩色,生成的圖像為偽彩色圖像。
(5)三維圖像(3D Image)
三維圖像是由一組堆棧的二維圖像組成。每一幅圖像表示該物體的一個橫截面。數字圖像也用于表示在一個三維空間分布點的數據,例如計算機斷層掃描(Computed Tomography,CT)設備生成的圖像,在這種情況下,每個數據都稱作一個體素。