2.2 深度線索
形成視覺空間知覺(視空間知覺)需要獲取立體感和遠近感,即深度知覺。深度知覺是對同一物體的凹凸或對不同物體的遠近的反映。不同的深度提取原理形成不同的深度線索,包括心理深度線索、運動深度線索、立體深度線索、生理深度線索等。
2.2.1 心理深度線索
視空間知覺的獲得是雙眼協調并用的結果,但在很多時候使用單眼仍然可以獲得準確的空間知覺,因為通過人的心理作用可以在平面圖像上形成深度線索,提取3D信息。絕大部分心理深度線索的提取,需要事先對所觀察物體有一定的了解。心理深度線索又叫單像深度線索或單眼深度線索。
1.基于光覺的心理深度線索
基于光覺的心理深度線索包括遮擋、陰影與高光、影子等。
遮擋是指兩個或多個物體在同一平面上,其中一個物體的一部分被另一個物體所遮蓋,形成的重疊現象。由遮擋或重疊所構成的畫面就可以使人產生深度知覺。被遮蓋的地方看起來距離較遠,全部顯露出來的地方看起來距離較近。
投射陰影與反射高光是指人眼的光覺功能通過分析物體表面的光強程度,感知物體的體積、質感和形狀。如圖2-13(a)所示,通過陰影與高光的明暗對比,可以感知物體的凹凸感(立體感)。如圖2-13(b)所示,物體投射陰影一面離光源較遠,相對較暗,從陰影的后退程度可以提取深度線索。物體反射高光一面離光源較近,相對較亮,從高光,特別是光澤物體的高光突出程度可以提取深度線索。

圖2-13 陰影與高光
影子的深度線索與陰影幾乎一樣。通過辨認被光照物體生成的影子,能感受到那個物體的空間位置。如圖2-14所示,由于影子的存在,右圖的花瓶位置比左圖的花瓶感覺更靠近觀看者。

圖2-14 影子
2.基于色覺的心理深度線索
人眼的色覺功能使同樣大小、同樣形狀的物體在不同顏色的渲染下會給人以不同距離的感覺:亮度較高的物體給人的感覺要比亮度較低的物體近;亮度相同的顏色,波長較長的光線給人近的感覺;暖色調的物體給人的感覺要比冷色調的物體近。
空氣透視是典型的基于色覺的心理深度線索。空氣透視是指空氣中的微粒對光的散射與吸收使景物的對比度隨著距離的增大而下降,導致遠處物體在細節、形狀和色彩上發生衰變,使人有一種強烈的深度感。由于空氣的介質作用,使遠處的物體不如近處的物體清晰,所以空氣透視也叫空氣模糊。如果是水汽擴散形成的空氣透視,因為短波長的藍色光更容易穿透空氣抵達視網膜,所以遠處的物體顏色一般偏藍色。如果是灰塵、硫酸、硝酸等污染物形成的空氣透視,由于這些污染物在削弱能見度的同時更容易散射波長較長的光,所以遠處的物體顏色一般偏灰色或棕色。如圖2-15所示,通過遠景偏灰色、偏藍色,從而可以判斷物體的遠近距離。

圖2-15 空氣透視
3.基于形覺的心理深度線索
基于形覺的心理深度線索包括相對大小、紋理梯度、視界高度、線性透視等。
被觀察對象的相對大小也叫視網膜像大小,是在確知對象物體大小的前提下,因為物體在視網膜上的成像與距離、幾何尺寸等有直接關系,所以距離越近的物體在視網膜上成的像越大,距離越遠的物體在視網膜上成的像越小。例如,看到圖片上大象和人一樣大時,就會認為大象距離觀察者更遠,因為大象要比人大很多。這種小的物體距離遠,大的物體距離近的視覺現象,稱為透視現象。
紋理梯度又稱質地梯度或結構梯度,指在某個維度上某種物體的遞增或遞減,相應地表現為物體在視網膜上的投影大小及投影密度上的遞增和遞減。如圖2-16所示,站在一條磚塊鋪的路上觀察遠處,隨著距離的增加產生近處稀疏和遠處密集的紋理梯度,由于在視網膜上的遠處部分每一單位面積上的磚塊影像的數量較多,所以越遠的磚塊顯得越小,于是產生了向遠方伸延的距離知覺。

圖2-16 紋理梯度
視界高度指受地球重力支配,在視界上方看到的是遠景,在視界下方看到的是近景。如圖2-17所示,根據這個經驗,可以判斷視界內物體的遠近距離。

圖2-17 視界高度
線性透視指平面上刺激物本身在面積的大小、線條的長短及線條之間距離遠近等特征上,所顯示出的能引起深度知覺的線索。同樣大小的物體,近大遠小。觀察景物時,景物的輪廓線條或許多物體縱向排列形成的線條,越遠越集中,甚至會聚。這樣一組線稱為消失線,消失線的會聚點稱為消失點(或滅點)。現實環境中的典型消失線為地平線,離地平線越近,物體越遠。同樣,圖像中的物體離消失點越近,感知深度越大,反之越小。如圖2-18所示,根據消失點數目的不同,線性透視分為一點透視、兩點透視和三點透視三種。一點透視看到物體的正面,兩點透視看到物體兩個以上的面并且面的兩側垂直,三點透視看到物體兩個以上的面并且面的兩側不垂直。

圖2-18 線性透視
在歐幾里得(或稱笛卡兒)空間永遠都不會相交的兩條平行線,在投影空間會相交于無限遠處,如兩條鐵軌在地平線處看起來相交于一點。在計算機圖形學中,將3D場景投影到2D平面需要采用齊次坐標。如式(2-3)所示,2D齊次坐標(x,y,w)中的新分量w=0時,對應笛卡兒坐標點(X,Y)移到無限遠處。

2.2.2 運動深度線索
運動的物體同時揭示了物體的速度、方向、空間位置。通過運動可以創建影像物體或影像場景的三維模型。因為運動是相對的,根據觀察者與物體之間的關系,運動深度線索分為人動而物體不動的視點運動視差、物體動而人不動的物體運動視差及物體相對運動速度。運動視差提取的深度線索比心理深度線索更可靠,因為偽造運動視差的難度很大。
1.視點運動視差
在無法清晰判斷前方多個物體之間的具體深度關系時,人會習慣性地左右移動頭部來確定這些物體在場景中的具體位置關系。頭部移動引起眼睛移動的視點運動,使頭部移動前后在視網膜上接收到的圖像存在差異,形成視點運動視差。從行駛的車窗向外看到遠近物體的運動,就屬于視點運動視差。
頭部移動前后獲得的兩幅圖中,同一對象的兩個位置的間距就是視差。視差可以用運動矢量表示,矢量的大小與方向通常用于描述所觀察物體離開觀察者的深度距離。近處的物體視角大,在視網膜上運動的范圍大。遠處的物體視角小,在視網膜上運動的范圍小。
如圖2-19所示,觀看單個靜止對象A時,設定頭部移動距離為M,觀察對象A的運動視差就是頭部位置H1和H2在水平方向上的距離。因為觀看距離D遠大于頭部移動距離M,所以角度θA(絕對運動視差)可以表示為


圖2-19 觀看單個物體的視點運動視差
根據式(2-4),如果M已知,則視覺系統利用絕對運動視差θA,可以估算出距離D。
如圖2-20所示,當被觀察對象A后面還有一個對象B,到觀察者之間的距離為D+d時,根據式(2-4)可以求得對象B的絕對運動視差θB。對象A和B的相對運動視差?為


圖2-20 觀看多個物體的視點運動視差
根據式(2-5),有

根據式(2-6),已知相對運動視差?、頭部移動距離M、對象距離D,可以計算出兩個被觀察對象的進深d。如果頭部移動距離和運動視差的比值一定,則進深d與絕對距離D的平方成正比。
2.物體運動視差
運動物體在不同的時間點上,離觀察者的距離不同,呈現的圖像信息不同,從而形成不同的視差信息,可以形成立體視覺。物體運動視差提供連續知覺,形成立體視覺所需的信息,所以稱為時間軸上的立體視,即時間積分立體視。
通過觀察運動物體的運動速度,可以大致判斷運動物體的距離。從跑道中央觀察飛機的起飛過程,可以看到飛機不斷地加速,過了觀察點上方速度就降了下來,之后離觀察點越遠,速度越慢,直到有停止的感覺。在高空飛翔的飛機,如果沒有云層的參照,好像停在天空中。所以,運動物體離觀察者越遠,看起來運動速度越慢。
如圖2-21所示,設定對象A到觀察者之間的距離為D,對象A僅移動距離m,運動的結果是對象A在運動方向上變化角度θA。這個絕對的物體運動視差θA可以表示為


圖2-21 物體運動視差
式(2-7)和式(2-4)在計算深度距離D的原理是一樣的。
3.物體相對運動速度
遠近不同的物體產生在不同速度下的像,在人腦意識中表現為:近處物體移動得快,遠處物體移動得慢。所以,當不同的物體同時運動時,可以從遠近物體的運動矢量中提取對應的深度線索。
如圖2-22所示,兩個被觀察物體A和B,B在A后面,與觀察者之間的距離為D+d,A和B之間的相對運動視差ω為


圖2-22 兩個物體等速運動視差
整理式(2-8),可得

根據式(2-9),已知運動視差ω、對象運動距離m、對象距離D,可以求出對象進深d。如果對象運動距離m和運動視差ω的比值一定,對象進深d與距離D的平方成正比。此外,如式(2-10)所示,對象進深d也可以用對象A和B的絕對運動視差θA和θB表示。

如果被觀察的多個物體運動速度不同,當參照物體的運動速度知道后,另一個物體的相對運動速度就是一個單像深度線索。影視拍攝也常模擬這種運動視差來營造一種縱深效果。在圖2-23中,如果知道飛機A的速度,通過測量飛機B、C與飛機A之間的相對速度,就可以大致判斷飛機B、C與飛機A的距離。

圖2-23 物體相對運動速度
坐火車時,以火車為參照物,無論是近處的還是遠處的景物相對于火車來說都是向后運動的。但移動相同的距離,近處的景物對人的眼睛造成的視角大些,所以看起來移動的速度快些。所以在火車上的人看來,近處的景物向后運動得快,而遠處的景物向后運動得慢。當人同時看近處和遠處的景物時,人會不自覺地以近處的景物為參照物,這樣看起來遠處的景物就在向前運動了。實際上,過一會兒再看,遠處的景物也落到火車后面去了。
2.2.3 立體深度線索
立體深度線索基于雙眼視覺功能,利用左右雙眼視網膜圖像的細微差異創造出深度感。所以,立體深度線索又稱為雙眼深度線索。其中,左右雙眼分別代表一個視點,說明立體深度線索是一種特殊的視點運動視差深度線索。但是,左右雙眼屬于同時視覺,所以立體深度線索可以獲得比運動視差更多、更準確的深度線索。立體深度線索主要包括雙目視差、遮擋提示、形變等。
1.雙目視差
雙目視差是一個完整的立體視覺生理功能,是人眼最強烈的深度線索與生理立體視覺因素。在排除了其他所有深度線索的條件下,一組完全無意義的視覺刺激,只要具備視差條件,即能產生深度知覺。
在空間場景中,同一物點投影到左右雙眼的視差圖像所成的像點稱為同源像點,而同源像點的位置差異定義為視差。分別向左右雙眼投射具有視差的圖像對,為雙眼提供視差信息,可以在人腦中形成立體視覺。
雙目視差產生的前提是雙眼存在6.5cm左右的瞳距,并且雙眼視野存在重疊。這樣,左眼看到物體的左邊多一些,右眼看到物體的右邊多一些,兩個視網膜像不完全重合,它們都偏向鼻側,如圖2-24所示。觀察物體時,左右雙眼視網膜上的物像差異就是雙目視差。基于雙目視差原理的立體顯示為觀看者的左右雙眼提供同一場景的立體圖形對,采用光學等手段讓觀看者的左右雙眼分別只能看到對應的左眼視差圖像和右眼視差圖像,從而使觀看者感知到立體圖像。

圖2-24 雙目視差
2.遮擋提示
遮擋是前后物體相互重疊,是最簡單也是明顯的深度線索。作為單像深度線索,遮擋就是前像擋住后像,把部分背景物體隱藏起來。
作為立體深度線索,如果背景物體還有一小部分能夠被一只眼睛看到,則這一小部分就成為大腦重建場景的主要深度線索。如圖2-25所示,在右眼視網膜的圖像中,房子擋住了樹,可以獲得簡單的房子在前樹在后的深度線索。在左眼視網膜的圖像中,房子與樹完全分離,補充提示了右眼不能獲得的樹的更多、更準確的信息。

圖2-25 遮擋提示
3.形變
憑借看到物體的多少,或者與一個參考形狀相比較,就可以獲得足夠的信息來推斷缺少的信息,如判斷物體的距離和形狀。如圖2-26所示的骰子,左側的左眼圖看不到5點,右側的右眼圖看不到3點。骰子形狀沒變,但每只眼睛看到的是不同的面,大腦將兩幅圖片組合成一個立體的物體。因為左右雙眼的距離為6.5cm左右,使得每只眼睛看到的物體側面信息與物體的大小、距離形成關聯。拿在手上的骰子看到的側面要比放在桌上另一端的骰子所看到的側面多一些。

圖2-26 骰子的形狀變化
在雙目立體顯示中,戴上3D眼鏡后,觀察者從屏幕正前方慢慢移動到屏幕斜方向,3D場景跟著傾斜。這就是立體深度線索中的形變效應。觀察者從屏幕正前方移動到屏幕斜方向,大腦本能地希望能夠看到與正前方不同的斜方向3D場景。但是,原本靜止的正前方3D場景并沒有發生變化。為了在屏幕斜方向滿足大腦的期望,大腦本能地認為3D場景跟著雙眼移動并發生形變。作為立體深度線索的形變效應,必須雙眼協調才能感受到。如果閉上一只眼睛就不能感受到3D場景跟著傾斜的現象。
2.2.4 生理深度線索
肌肉、肌腱和關節囊中分布有肌梭與腱梭等本體感受器,能夠分別感受肌肉被牽拉的程度及肌肉收縮和關節伸展的程度。這種本體感受器受到刺激所產生的軀體運動覺稱為本體感覺。與深度線索有關的本體感覺都要通過眼睛的內部生理結構獲得。所以,本體感覺獲得的深度線索又稱為生理深度線索,包括單眼立體視覺的焦點調節和雙眼立體視覺的輻輳。支撐生理深度線索的眼球運動,由六條眼外肌協同完成。所以,同樣受到眼外肌控制的單眼焦點調節和雙眼輻輳運動具有聯動效應。具體地,輻輳角增大的斗雞眼狀態與觀看近處物體的晶狀體增厚聯動發生,輻輳角變小與觀看遠處物體的晶狀體變薄聯動發生。
1.焦點調節
人眼的適應性焦點調節指眼睛的睫狀肌調節晶狀體的屈度使圖像落在視網膜的中央凹上,以保證網膜圖像的清晰。焦點調節可以提供單像深度線索。如圖2-27所示,看遠處物體時晶狀體較扁平,而看近處物體時晶狀體較凸起。通過焦距的變化,可以看清楚遠近不同的景物和同一景物的不同部位。

圖2-27 人眼的適應性焦點調節
晶狀體的調節是通過其附屬肌肉的收縮和舒張來實現的。肌肉的運動信息反饋給大腦,給大腦提供了物體遠近的信息,有助于立體感的建立。人眼的最小焦距為1.7cm,沒有上限。一般這種線索所提供的信息只限于距眼睛10m以內才有效,并且分辨力較差。設定能夠清晰聚焦的最遠點為Pf,最近點為Pn,Pf?Pn就是焦點調節的檢出深度。調節固定時的聚焦深度T為

式中,n和f分別表示位置Pn和Pf上的物體能被清晰分辨出來的距離,單位為m。
2.輻輳
雙眼注視遠處物體時,雙眼的視軸是平行的,調節是放松的。看近物時,雙眼不但產生調節,而且雙眼的視軸也要向鼻側轉。這種使兩只眼睛的視軸在被觀察物體的某一點上相交,該點視像落在兩只眼睛中央凹的作用稱為輻輳,又稱雙眼集合。
觀看客觀景物時,輻輳的同時,晶狀體的聚焦點會調節到最適當的位置(注視點)以減輕模糊,即輻輳距離與焦點調節距離是一致的。由于雙眼輻輳的會聚程度受到眼外肌的控制,所以在觀察近處物體和遠處物體時,肌肉緊張程度的差異所產生的本體感覺會給大腦提供物體遠近的深度或距離線索。
如圖2-28所示,輻輳存在一個眼睛休息時的舒適輻輳距離,稱為調節休息點(Resting Point of Accommodation,RPA)。當注視物體持續靠近鼻子到達輻輳近點時,輻輳角達到最大值,會聚程度最高,注視物體繼續靠近鼻子時兩眼放棄會聚而突然轉向外側,形成復視。出現復視前的臨界點稱為調節近點(Near Point of Accommodation,NPA)。最近點的距離zn一般為250mm左右。當注視物體遠離鼻子達到一定程度時,雙眼輻輳接近平行,輻輳角接近0°,已不能提供有效的輻輳信息。

圖2-28 輻輳提供深度線索的原理
雙眼圖像的融合過程需要雙眼的著眼點在同一固定點上,左右眼分別到著眼點的光軸與雙眼瞳距線段構成的夾角是確定的,在幾何上構成了一個確定的三角形。通過這個三角形可以判斷出被觀察景物與人眼的距離。根據圖2-29所示的輻輳立體深度的三角形關系,利用dθ/dz的輻輳角θ定義,可以推導出景物距離Δz:


圖2-29 輻輳立體深度
式中,b為兩眼瞳距,z為平均對象距離。一般,4z2 ?b2,式(2-12)可以簡化為

如圖2-30所示,當雙眼觀看物體P和M時,輻輳使物體圖像落在視網膜相對應的位置(p1/m1和p2/m2),角α為輻輳角。當觀看更遠的Q點物體時,輻輳角減小為β,稱為“開散”。這種改變由眼部肌肉完成,這種改變的信號傳到大腦,便構成一種對深度信息的感知。

圖2-30 輻輳
2.2.5 深度感知范圍
深度知覺的準確性是對深度線索敏感程度的綜合測定。觀察距離較近的物體,生理方面的深度線索,特別是雙眼深度線索起著決定性的作用。觀察距離較遠的物體,心理方面的深度線索起著決定性的作用。隨著被觀察對象的距離越遠,深度知覺的準確性越低。
1.深度線索的距離感知范圍
人眼視覺是以雙眼單視為基礎發展起來的立體視覺,該視覺系統需要同時擁有單眼深度線索與雙眼深度線索來感知三維信息。
單眼深度線索強調視覺刺激本身的特點,深度知覺的準確性不存在距離上的顯著差異。單眼立體視可以根據平面視覺信息判斷出立體視,只需單只眼睛就能感知立體信息。單眼深度線索包括運動視差、焦點調節、視界高度、空氣透視、遮擋、相對大小、紋理梯度、陰影、影子。
雙眼深度線索強調雙眼協調活動所產生的反饋信息的作用,深度知覺的準確性隨著距離的增加而降低。雙眼立體視就是同時使用左右眼獲取立體感,立體視一般指雙眼立體視。雙眼視覺可以實現單眼無法感知的空間知覺,使人能夠更準確地獲得外界物體形狀、方位、距離等概念,從而適應自身在客觀環境中的位置。雙眼深度線索包括雙目視差和輻輳。
單眼立體視與雙眼立體視的有效范圍關系如圖2-31所示。圖中曲線采用對數刻度,原點相當于觀察者站立的位置,橫軸表示遠處物體距離D1與近處物體距離D2的平均距離,縱軸表示遠近物體之間的距離(D1?D2)與遠近物體平均距離(D1+D2)/2之比。圖中坐標(2m,0.01)的一種可能是:近處物體距離D2=1.99m,遠處物體距離D1=2.01m,D1和D2的平均值為2m。判別兩個被觀察物體的前后關系,僅僅相差2cm(201cm?199cm),對應的立體視感度用比值0.01(2cm÷200cm)表示。如果兩個被觀察物體的平均距離為200cm,而兩者間距縮小為1cm時能判斷前后關系,對應0.005(1cm÷200cm)處理論上可以制圖,事實上沒有,說明沒有對應的深度線索。

圖2-31 單眼立體視與雙眼立體視的有效范圍關系
圖2-31說明,觀察一定距離的物體,縱軸數值越小的深度線索越能用于分辨微小的前后關系。在橫軸上,綜合空間距離相關的各種深度線索,觀察不同距離時的貢獻程度如下。
(1)近距離(1m以內):絕大部分深度線索同時啟動,協同作用,相互平衡,起關鍵作用的深度線索為雙目視差、輻輳、焦點調節和運動視差。
(2)中距離(1~3m):雙眼深度線索和單眼深度線索所起的作用此消彼長,起關鍵作用的深度線索為雙目視差、輻輳、焦點調節、運動視差等。
(3)遠距離(3m以上):以心理方面和經驗方面的單眼深度線索為主,起關鍵作用的深度線索為線性透視、運動視差等。
2.視差立體視覺的深度感知范圍
雙目視差是立體視覺的主要深度線索。注視觀察對象時,在左右眼視網膜上形成的兩幅圖像的視差大小可以用被觀察對象在視網膜上的投影寬度表示,也可以用雙目視差角的大小表示。
如圖2-32所示,近處像點A、遠處像點B、最遠處像點C在左右雙眼視網膜上的投影分別為(AL,AR)、(BL,BR)、(CL,CR),左右雙眼的水晶體光心分別為OL和OR。A、B像點的視差就是ALBL與ARBR的差值,AC像點的視差就是ALCL與ARCR的差值。因為A、C像點的距離比A、B像點的距離大,所以差值(ALCL?ARCR)比差值(ALBL?ARBR)大。
在圖2-32中,可以用像點在左右雙眼的兩個張角之差來表示視差的大小。因為對角∠BX1OL=∠AX1OR,所以在△BX1OL和△AX1OR中,存在關系∠X1AOR?∠X1BOL=∠X1OLB?∠X1ORA。同理,在△CX2OL和△AX2OR中,存在關系∠X2AOR?∠X2COL=∠X2OLC? ∠X2ORA。實際觀察像點,當張角很小時,張角的大小可以用張角所對應的弦來替代,所以,存在如下等式:


圖2-32 視差大小示意圖
當雙眼觀察不同距離的兩個點時,兩個點的距離差值必須超過一定的限度,才能辨別出兩者的深度差異。能夠區分出視野中兩個空間距離非常近的物體并感知物體立體感的能力,用視差閾值表示。在圖2-32中,被觀察對象的距離越遠,張角越小,立體感趨于模糊。當觀察距離非常大時,投影到視網膜上的視差就小于視差閾值,人眼無法分辨物體的深淺程度,立體感消失。最小閾值就是這個最小距離形成的視角,閾值的倒數體現銳度。
在圖2-33中,雙眼瞳距用2e(一般為65mm)表示,注視點P1和P2在雙眼處的張角分別用θ和θ'表示,用η表示雙目視差。根據雙目視差的定義,η=θ?θ'。考慮到觀察距離非常遠時,張角很小,θ=2e/z,θ'=2e/(z+Δz)。把張角θ和θ'的公式代入雙目視差η的公式,可得


圖2-33 視差閾值示意圖
存在η時的zΔz遠小于z2,所以式(2-15)可以簡化為

正常視力的視差閾值η=40″(弧秒),代入式(2-16),可以建立z和Δz之間的等式關系。計算不同觀看場景的人眼最小分辨尺寸時,張角θ'在P1位置的寬度w,可以對應顯示屏的像素節距、透鏡等光柵節距、三維顯示體像素節距等。求得最小可分辨尺寸w,可以評估顯示屏像素最小尺寸、透鏡光柵單元的最小節距。