- 多媒體通信技術(shù)基礎(chǔ)
- 蔡安妮等編著
- 2018-12-27 16:46:45
第2章 視覺特性和彩色電視信號
2.1 人的視覺特性
2.1.1 圖像對比度與視覺的對比度靈敏度特性
1.圖像的對比度
對比度表示圖像相鄰區(qū)域或相鄰點之間的亮度差別。對比度C由下式定義:
式中,Imax、Imin分別代表圖像中的最大和最小亮度。
在自然景物中,對比度經(jīng)常可以達到200∶1,甚至更高。電視機和顯示器只有給出類似的對比度,電視上的景物才有自然景物那么明亮和層次豐富。
2.視覺的對比度靈敏度特性
在給定的某個亮度環(huán)境下,人眼剛好(以50%的概率)能夠區(qū)分兩個相鄰區(qū)域的亮度差別所需要的最低對比度,稱為臨界對比度,或稱為視覺閾。在研究數(shù)據(jù)壓縮技術(shù)時,人們關(guān)心人眼是否能夠察覺到壓縮所引入的圖像(對比度)失真,因而對視覺閾的研究就是十分必要的了。臨界對比度的倒數(shù),稱為對比度靈敏度。
視覺閾的大小與觀察條件(如周圍環(huán)境的亮度、鄰近區(qū)域亮度的變化等)有關(guān)。假設(shè)我們考慮圖2-1(a)所示的情況,其中環(huán)境亮度為LS,圖的中間有一個張角為1.5°、亮度為LB的環(huán),環(huán)內(nèi)包圍著一個亮度為L的小區(qū)域。調(diào)節(jié)L的大小使其剛好能被覺察到與LB有所不同,則L-LB=ΔL為視覺閾。在不同的LS下,經(jīng)實驗得到ΔL隨LB變化的曲線如圖2-1(b)所示。在LS=LB的情況下,ΔL/LB接近于常數(shù),這稱為韋伯(Weber)定律。ΔL與LB成正比意味著,人眼區(qū)分圖像亮度差別的靈敏度與它附近區(qū)域的背景亮度(平均亮度)有關(guān),背景亮度越高,靈敏度越低。

圖2-1 視覺閾的測量(背景亮度固定)(A.N.Netravali and B.G.Haskell,Digital Pictures:Representation,Compression and Standards,2ndEd.,Plenum Press,New York,1995)
3.空間域的掩蔽效應(yīng)
視覺閾的大小不僅與鄰近區(qū)域的平均亮度有關(guān),還與鄰近區(qū)域的亮度在空間上的變化(不均勻性)有關(guān)。假設(shè)將一個光點放在亮度不均勻的背景上,通過改變光點的亮度測試此時的視覺閾,人們發(fā)現(xiàn),背景亮度變化越劇烈,視覺閾越高,即人眼的對比度靈敏度越低。這種現(xiàn)象稱為視覺的掩蔽效應(yīng)(Masking)。
2.1.2 空間頻率與視覺的空間頻率響應(yīng)
1.空間頻率
人們所熟悉的時間頻率是用單位時間內(nèi)某物理量(如交變的電流、電壓、波動或機械振動等)周期性變化的次數(shù)來定義的,單位為周/秒。類似地,空間頻率的定義是:物理量(如圖像的亮度)在單位空間距離內(nèi)周期性變化的次數(shù),即
式中,fx表示亮度信號在x方向的空間頻率,x是空間距離變量,(x)表示亮度信號沿x方向的相位變化。
以圖2-2(a)所示的正弦光柵為例,如果光柵亮度在1厘米內(nèi)變化10次,那么它的空間頻率為fx=1000周/米。

圖2-2 空間頻率的單位
人們通常有這樣的經(jīng)驗,從不同距離上觀察空間頻率相同的正弦光柵,感覺光柵亮度變化的密集程度是不同的。因此在涉及觀察者時,需要將空間頻率用每度多少周表示,這里的度是幾何角度的單位。這樣表示的空間頻率可以理解為從某一觀察點來看,亮度信號在單位角度內(nèi)周期性變化的次數(shù),即
式中,α為圖2-2(b)中所表示的角度,(α)代表亮度信號在角度α內(nèi)的相位變化。兩種空間頻率單位間的轉(zhuǎn)換可以通過圖2-2(b)來推算。假設(shè)圖中S
r,則存在如下的近似關(guān)系:
式中,α的單位為弧度。因為信號在S長度內(nèi)變化的周期數(shù)等于在α角內(nèi)變化的周期數(shù),故可得下式:
式中,fx的下角標m和d分別用來區(qū)別以長度為單位和以角度為單位的空間頻率。將(2-4)式代入(2-5)式,得到fxd和fxm之間的轉(zhuǎn)換公式
二維圖像的空間頻率譜可以用二維的傅氏積分來表示,即
式中,L(x,y)為亮度在x-y平面上的分布函數(shù),x、y為圖像的平面坐標,fx、fy分別是在x、y方向上的空間頻率。
對于圖2-3(a)所示的正弦光柵,其亮度函數(shù)為
根據(jù)(2-7)式得到它的頻譜如圖2-3(b)所示,其中包含直流分量和fx=fx0、fy=fy0的頻率分量。與一維的頻譜分析相類似,任何一個復(fù)雜的亮度函數(shù)(圖像),都可以通過傅氏分析將其分解成為一系列不同頻率分量(正弦光柵)之和。

圖2-3 一個正弦光柵和它的空間頻率譜

圖2-4 視覺的對比度靈敏度響應(yīng)(正弦光柵的亮度為600坎德拉/米2)(A.N.Netravali and B.G.Haskell,Digital Pictures:Representation,Compression and Standards,2ndEd.,PlenumPress,NewYork,1995)
2.視覺的空間頻率響應(yīng)
人的視覺系統(tǒng)基本上可以認為是一個線性系統(tǒng)。圖2-4給出了視覺對不同空間頻率的正弦光柵的響應(yīng)(A.N.Netravali and B.G.Haskell,Digital Pictures:Representation,Compression and Standards,2ndEd.,Plenum Press,New York,1995),它表示了該線性系統(tǒng)的頻率域特性。從圖可以看出,當(dāng)空間頻率在3~4.5周/度時,視覺的對比度靈敏度最高,即人眼對這些空間頻率的分辨能力最強。由于眼睛的光學(xué)孔徑大小的限制和視網(wǎng)膜上光敏細胞分布的密度不夠等原因,對于空間頻率高于50~60周/度的正弦光柵,人眼就很難分辨了。視覺系統(tǒng)頻率響應(yīng)在低端的下降,則需要用眼睛的橫向抑制效應(yīng)來解釋。
2.1.3 視覺的時間域響應(yīng)
1.視覺惰性與閃爍
人眼的視覺是有惰性的,這種惰性現(xiàn)象也稱為視像的暫留。就是說,當(dāng)眼前實際的景物已經(jīng)消失后,所看到的影像卻不立即消失。如果讓觀察者觀察按時間順序重復(fù)的亮度脈沖(如黑暗中不斷開、關(guān)的手電筒),當(dāng)脈沖重復(fù)頻率不夠高時,人眼就有一亮一暗的感覺,稱為閃爍。如果重復(fù)頻率足夠高,閃爍感覺消失,看到的則是一個恒定的亮點。閃爍感覺剛好消失時的重復(fù)頻率叫做臨界閃爍頻率。脈沖的亮度越高,臨界閃爍頻率也相應(yīng)地增高。
視覺惰性現(xiàn)象已被人們巧妙地運用到電影和電視當(dāng)中,使得本來在時間上不連續(xù)的圖像,給人以真實的、連續(xù)的感覺。在通常的電影銀幕亮度下,人眼的臨界閃爍頻率約為46Hz。所以電影中,普遍采用每秒鐘向銀幕上投射24幅畫面的標準,而在每幅畫面停留的時間內(nèi),用一個機械遮光閥將投射光遮擋一次,得到每秒48次的重復(fù)頻率,使觀眾產(chǎn)生亮度是連續(xù)的、不閃爍的感覺。人們也曾做過用遮光閥將每幅畫遮擋兩次的實驗,這時可以在不產(chǎn)生閃爍感覺的前提下將每秒鐘投影的畫面幅數(shù)減少到16,從而能夠進一步縮短電影復(fù)制所需的膠卷的長度。但是,每秒鐘投影16幅畫面時,對于速度稍高的運動物體,由于前一幅畫面和后一幅畫面中的物體在空間位置上的差別過大,會產(chǎn)生像動畫片那樣的動作不連續(xù)的感覺。在2.2.2節(jié)中我們將會看到,類似的思想也在電視中得到了應(yīng)用。
實驗表明,人眼在高亮度下對閃爍的敏感程度高于在低亮度的情況。對于今天的高亮度的顯像管而言,臨界閃爍頻率可能達到60~70Hz。
2.運動的連續(xù)性
一般來說,要保持畫面中物體運動的連續(xù)性,要求每秒鐘攝取的畫面數(shù)約為25幀左右,即幀率要求為25Hz;而臨界閃爍頻率則遠高于這個頻率。在傳統(tǒng)的電視系統(tǒng)中由于整個通道中沒有幀存儲器,顯示器上的圖像必須由攝像機傳送過來的畫面所刷新,所以攝像機攝取圖像的幀率和顯示器顯示圖像的幀率必須相同,而且相互是同步的。在數(shù)字電視和多媒體系統(tǒng)中,在最終顯示圖像之前插入幀存儲器是很簡單的事,因此攝像機的幀率只要保證動作連續(xù)性的要求,而顯示器可以從幀存儲器中反復(fù)取得數(shù)據(jù)來刷新所顯示的圖像,以滿足無閃爍感的要求。現(xiàn)在市面上出現(xiàn)的100Hz的電視機,就是用這種辦法把場頻由50Hz提高到100Hz。
3.時間域的掩蔽效應(yīng)
影響時間域掩蔽效應(yīng)的因素比較復(fù)雜,對它的研究還處于初始階段。這里僅介紹一些實驗結(jié)果,這些結(jié)果可能在數(shù)據(jù)壓縮方面有潛在的應(yīng)用價值。實驗表明,當(dāng)電視圖像中相鄰的畫面變化劇烈(如場景切換)時,人眼的分辨力會突然劇烈下降,例如下降到原有分辨力的1/10。也就是說,當(dāng)新場景突然出現(xiàn)時,人基本上看不清新景物,在大約0.5秒之后,視力才會逐漸恢復(fù)到正常狀態(tài),很顯然,在這0.5秒的時間內(nèi),傳送分辨率很高的圖像是沒有必要的。研究者還發(fā)現(xiàn)
,當(dāng)眼球跟著畫面中的運動物體而轉(zhuǎn)動時,人眼的分辨力要高于不跟著物體而轉(zhuǎn)動的情況。而通常在看電視時,眼睛是很難跟蹤運動中的物體的。
2.1.4 彩色的計量和彩色視覺
1.彩色的定量表示
人們在生活中,用紅、橙、黃、綠、青、藍和紫等名詞來描述彩色的大致范圍。如果再進一步地細分,紅色則有深紅、淺紅、大紅、粉紅等。即使這樣細分,仍然不能把顏色表達得很準確。
根據(jù)德國科學(xué)家格拉茲曼所總結(jié)的法則,任何一種彩色都可由另外的不多于三種的其他彩色按不同的比例合成。這意味著,如果選定了三種人所共知的標準基色(標準基色必須是獨立的,即其中一種不能由其他兩種產(chǎn)生),那么任何一種彩色,可以用合成這一彩色所需要的3種基色的數(shù)量來表示。例如,選擇波長分別為700nm、546.1nm和435.8nm的紅、綠、藍光作為基色,用不同比例的三基色光可以配出任何一種彩色。三種光的能量之和決定了合成光的亮度,而三種光強之間的比例關(guān)系決定了合成光的色調(diào)(顏色)和飽和度(顏色深淺)。一個任意光(A)和三基色光之間的關(guān)系可以寫成下式
(A)=ra(R)+ga(G)+ba(B)(2-9)
式中帶有括號的大寫字母只代表某種光。例如(R)只代表紅光,并不具有數(shù)量和量綱的含義,數(shù)量由它們各自的系數(shù)代表。
(2-9)式表明,在基色光(R)、(G)和(B)選定以后,任何一種彩色(A)都可以用三個相應(yīng)的數(shù)ra、ga和ba來表示。這事實上已經(jīng)解決了用數(shù)學(xué)的方法嚴格地定義彩色的問題。但是在實際的應(yīng)用中發(fā)現(xiàn),這樣的三個數(shù)有時相互之間在數(shù)量上可以相差幾個數(shù)量級,以至于有的數(shù)值小到在進行色度計算時可以忽略,而它在光的合成中卻起著明顯的作用,又不能忽略。解決這一問題的辦法,是用合成某種標準白光(如等能白光)所對應(yīng)的三個系數(shù)值,分別作為三種基色光的1個計量單位。以此計量單位度量的任意彩色(A)的三個系數(shù)稱為三色系數(shù)(Tristimulus),用R,G,B表示。
在R、G、B三種基色構(gòu)成的顏色空間中,以三色系數(shù)為坐標,任何一種彩色都可以由這三個坐標值所確定的矢量來表示。矢量的幅值代表了彩色的亮度,矢量的方向代表了它的顏色信息(色調(diào)和飽和度)。圖2-5中,坐標原點O是R、G、和B都等于零的點,代表黑色。與O點相對的立方體的頂點的三個坐標值都等于1,代表等能白色。從圖看出,具有同樣顏色、不同亮度的矢量都與虛線三角形相交于同一點,這說明虛線平面三角形內(nèi)的一點,唯一地確定了一種顏色;三角形包圍的區(qū)域定義了在這種三色坐標下所有可能產(chǎn)生的顏色。
圖2-5中虛線平面三角形中的一點唯一地確定一種彩色,說明彩色只需要兩個(而非三個)變量就可以描述。我們將三色系數(shù)作如下的歸一化:
則有r+g+b=1。這樣,一種彩色只需要兩個變量,例如r和g,就可以嚴格定義了。
由于用r和g來描述自然界中的彩色有計算上的不便之處,國際照明委員會(CIE)于1931年基于假想的三個基色X,Y,Z建立了一個標準色度系統(tǒng)。XYZ系統(tǒng)中的三色系數(shù)可以由RGB三色系數(shù)經(jīng)線性變換獲得。在XYZ系統(tǒng)中,以x和y(對應(yīng)于RGB系統(tǒng)中的r和g)為坐標表示的色度圖如圖2-6所示。圖中舌形的區(qū)域展示了人類可見的所有彩色,外側(cè)邊界是光譜(單色)光軌跡。一個多媒體或電視系統(tǒng)能夠展示給觀眾的彩色由其顯示設(shè)備所使用熒光粉的發(fā)光特性所決定。圖2-6中實線和虛線三角形的三個頂點分別代表PAL和NTSC電視系統(tǒng)R、G、B熒光粉的色坐標,中間E代表等能白色的色坐標,三角形包圍的面積代表該系統(tǒng)可以展示的彩色。
除了RGB和XYZ坐標系外,還有其他的彩色坐標系統(tǒng),如在電視和多媒體系統(tǒng)中經(jīng)常使用的YUV(見2.2.4節(jié)),在藝術(shù)和計算機視覺領(lǐng)域廣泛使用的HSV、HSI等。有興趣的讀者,可以參閱有關(guān)的文獻(A.N.Netravali and B.G.Haskell,Digital Pictures:Representation,Compression and Standards,2ndEd.,Plenum Press,NewYork,1995 [美]岡薩雷斯著.數(shù)字圖像處理(第二版).阮秋琦等譯.北京:電子工業(yè)出版社,2003)。

圖2-5 三維彩色矢量空間

圖2-6 x-y坐標色度圖
2.彩色視覺的空間頻率響應(yīng)
圖2-7給出了視覺對彩色變化的頻率響應(yīng)。由圖看出,人眼對亮度的分辨力要明顯的比彩色的高。對間隔較密的黑白正弦光柵我們可能可以分辨清楚,而同樣間距的藍黃光柵,我們可能分不清,而只能看到一片綠。

圖2-7 彩色視覺的空間頻率響應(yīng)
3.彩色的掩蔽效應(yīng)
在亮度變化劇烈的背景上,例如在黑白跳變的邊沿上,人眼對色彩變化的敏感程度明顯地降低。相類似地,在亮度變化劇烈的背景上,人眼對彩色信號的噪聲(如彩色信號的量化噪聲)也不易察覺。這些都體現(xiàn)了亮度信號對彩色信號的掩蔽效應(yīng)。
- 一起玩電子:電子制作入門、拓展全攻略
- Altium Designer Summer 09電路設(shè)計與制作
- 高可靠性電子裝備PCBA設(shè)計缺陷案例分析及可制造性設(shè)計
- 現(xiàn)代移動通信網(wǎng)絡(luò)技術(shù)
- 零起點學(xué)音響與影碟機維修技術(shù)
- 信息論與編碼原理
- 液晶彩電易損電路上門維修速查手冊
- 電子工程師自學(xué)速成:設(shè)計篇
- CMOS模擬集成電路全流程設(shè)計
- INSTANT Wireshark Starter
- TD-LTE無線網(wǎng)絡(luò)規(guī)劃與設(shè)計(“十二五”國家重點圖書出版規(guī)劃項目)
- Wireshark Essentials
- 大話傳送網(wǎng)(第2版)
- 認識通信
- 160招玩轉(zhuǎn)iPhone 5