- 流域生態系統恢復價值評估:CVM有效性與可靠性改進視角
- 蔡志堅 杜麗永
- 5448字
- 2020-06-05 19:26:42
4.3 WTP與CVM
CVM通過問卷調查來估算消費者對q的變化的WTP。由于詢價方法的不同,WTP在推導方法上也存在差異。尤其是采用封閉式問卷時,必須考慮分布函數設定問題??偟膩碚f,包括參數模型、非參數模型(Ayer et al. 1955; Kristr?m,1990; Copas,1983; Staniswalis and Cooper,1988)、半參數模型三類(Horowitz,1993)。
參數模型要求數據生成過程是已知的。其優點是對投標點的依賴性較弱,而且能夠包含更多的協變量信息,有助于檢驗有效性。但是,參數模型的分布函數形式一旦固定,就比較呆板,往往擬合效果較差。而非參數模型則與參數模型剛好相反,其分布函數形式是不確定的,其結果外延困難,但擬合效果卻比較好。參數模型操作簡便,可以外延,適于預測,但形式呆板,難以精確擬合復雜的曲線。非參數模型形式靈活,可以精確擬合復雜的曲線,但是操作相對復雜,難以較大幅度地外延預測。而半參數模型則兼具參數模型與非參數模型的優點。
當采用參數模型時,必須考慮以下幾個方面:分布函數是否允許負WTP、是否允許零WTP、如何保證弱單調性、分布函數尾端的平滑特征、估值約束問題(例如,WTP必須小于收入水平)。
WTP為負的含義是,政府即使反過來補貼一定的費用,公眾也不會支持推動該項目。由于污染治理不可能是吉芬商品,因此可以排除WTP為負的可能。但是,WTP為零卻是合理的。例如,某些受訪者可能對當前的環境質量基本滿意,維持現狀還是進一步改善對他們來說是無差異的。假定這部分人群所占的比例為θ,這就意味著在WTP=0處存在數據堆積現象,堆積程度由θ確定。由于零WTP具有明確的經濟含義,因此在數據分析時必須予以考慮。
根據需求理論,價格越高需求量就越低。類似地,投標值越高支付意愿也就越低。參數模型必須滿足關于投標值A的弱單調遞減性。在參數模型下,若選取生存函數,則弱單調遞減性自然得到滿足。如果采用的是非參數模型,則可通過PAVA算法(Pool Adjacent Violators Algorithm)保證弱單調性。
最后一個問題是如何處理概率分布函數的右尾。即,在右尾端所允許的最大WTP的大小直接決定了平均WTP的大小。直觀上,可以直接詢問受訪者的最大支付意愿,但正如我們在第三章所討論的那樣,開放式調查并不十分可靠。另外一種選擇是以收入水平作為WTP的上限,例如不超過收入水平的5%。
4.3.1 開放式問卷
開放式問卷(open-ended questionnaire)非常直觀,調查人員直接詢問受訪者最多愿意為環境改善支付多少費用,每個受訪者都會回答一個具體值。WTP可根據樣本的平均值或中位數直接得到。例如,假定樣本量為n,每個受訪者愿意支付的最高值為Ai,則平均支付意愿為

中位數支付意愿為

當調查中有少數受訪者的支付意愿特別高時,WTPe就會存在偏差。例如詢問1000位受訪者對水質改善的WTP,其中999人最大支付意愿在500元以下,但是第1000位受訪者的支付意愿卻高達2000元。微觀調查數據的可獲得性極低,每一份問卷都來之不易。對待這樣的異常值,首先要判斷其是否可信,直接刪除并非首選。例如,考察與其收入水平是否相符,與其身份是否相符等。如果異常值通過了這些初步篩選,則應予以保留;反之若初步檢驗無法通過,則至少存在三種處理方式。一是將異常值從樣本中直接刪除;二是將異常值刪除,但追加適宜的觀測值計入樣本(如以次高值或次低值替換異常值);三是尋找異常值產生的實際原因并進行修正。當然,異常值所影響的是平均WTP,而對中位數WTP通常影響甚微,以中位數WTP作為最終評估標準可能更為合適。
當真實WTP服從正態分布時,WTP e具有最小方差。然而在CVM中,真實WTP通常不會服從正態分布,因為正態分布允許存在負值,而WTP通常是非負數。當總體服從非正態分布時,均值估計仍然是有效的估計量,但是采用極大似然估計得到的估計值更有統計效率。當然,此時需要設定WTP的具體函數形式。開放式問卷的另外一個問題是會造成數據堆積,即大量受訪者會集中回答少數幾個值(如20元、50元等),造成舍入誤差。
在開放式問卷下,計量模型的主要作用是討論WTP的影響因素,例如檢驗WTP是否隨著收入的增長而增長。在開放式問卷下,受訪者所陳述的WTP為受限因變量(Censored Variable),一般來說不會出現負值。因此,在分析WTP的影響因素時,經典的最小二乘法可能造成估計系數偏差。
當被解釋變量具有上限、下限或存在極值時,可采用Tobit模型進行分析。人們為了紀念Tobin對被解釋變量取值有限制、存在選擇行為的模型的貢獻,稱之為Tobit模型。
假定WTP為解釋變量的線性形式,且具有可加性誤差項:

WTP*k是無法觀察到的潛變量,表示受訪者的真實WTP。受訪者所陳述的支付意愿定義為WTP k。在標準的Tobit模型下,有

這樣設定意味著因變量為受限的正態變量。我們稱上述設定為第1類Tobit模型(Tobit1)。潛變量的期望為E[WTP*k]=βz k,而受限因變量的期望為

式中,Φ(z)和φ(z)分別為標準正態分布函數和標準正態密度函數。
在Tobit1模型下,WTP原則上可以取為負值或正值,而零響應被假定源于不可觀察性。但是,這種設定并不適用于CVM研究,因為在CVM的實際運用中,零WTP具有明確的經濟含義。
零WTP是受訪者決策的結果,而不是不可觀測的原因造成的。不僅如此,在Tobit1模型下,還隱含著一個較強的假設:給定WTP>0,自變量對支付多少的影響和對是否愿意支付的影響完全相同。換句話說,Tobit1模型沒有將零響應和正響應兩種不同的機制區分開來。因此,需要引入雙方程模型(two-equation model)分別模擬兩種決策機制。
雙方程模型有很多種類型,這里采用較為簡單的設定形式:


若d*=0則WTP=0;若d*=1則WTP=WTP*。E[WTP|WTP>0]=βzk。當受訪者的支付意愿大于零時d*=1,反之則d*=0。因此式(4-13)是關于是否愿意支付的決策過程,而式(4-14)是關于支付多少的決策過程。由于式(4-14)只考慮因變量為正的情形,因此可以采用截斷回歸方法(Truncated Regression)進行分析。
但是,假定式(4-13)和式(4-14)彼此獨立可能并不符合現實。例如,收入水平對兩個決策過程的影響同時為正。一個修正方法是,假定式(4-13)和式(4-14)的殘差存在相關性(稱之為Tobit2模型):

這樣,ρσεθ(γ, zk, σu)實際上度量的是樣本選擇偏差的影響。當ρ=0時,Tobit1模型實際上是Tobit2模型的一種特殊情況。如果無法拒絕ρ=0的原假設,則表明樣本選擇偏差的影響不會太大,此時可以將抗議性樣本直接刪除。必須強調的是,國內研究中只有少數學者在開放式問卷下考慮了Tobit1模型,但文獻檢索尚未發現有基于Tobit2模型的CVM研究成果。
4.3.2 支付卡式問卷
支付卡式問卷提供一組數據,讓受訪者從中挑選出最大(小)的支付(受償)意愿?;谥Ц犊ǖ腃VM其WTP估算方法也可分為兩種。其中一種和開放式CVM完全相同,直接計算平均值或者中位數,這也是國內CVM研究文獻常用的方法。但是,簡單地給出平均值或者中位數,會受限于支付卡所列出的投標點。例如,受訪者的選擇可能會局限于10元、20元、50元、100元等少數幾個離散點上。此外,簡單算術平均法也無從分析受訪者的人口統計特征和社會經濟變量對其選擇的影響。
實際上,支付卡所揭示的是受訪者真實支付意愿的區間而非真實值。例如,假定支付卡為[0,5,10,15,20],當受訪者選取15元時,更為準確的理解是該受訪者的真實WTP不低于15元但低于20元。而直接選取間隔數據[15~20]的組中值進行OLS估計,可能會造成模型系數和平均WTP出現偏差,因為組中值并不一定就等于區間上的期望值。
更為理想的替代方法是Cameron和Huppert(1989)所提出的間隔數據分析方法。由于WTP的取值為非負,因此假定WTP服從對數正態分布:

WTP*k為受訪者k的真實WTP, εk服從均值為零、標準差為σ的標準正態分布。

Φ為標準正態分布的累積函數。相應的對數化極大似然為

中位數WTP的計算公式為exp(βzk),而平均WTP根據exp(βzk)exp(σ2/2)進行計算。
4.3.3 封閉式問卷
封閉式問卷(close-ended questionnaire)需要設定WTP的函數分布形式,包括參數模型、非參數模型以及半參數模型三類,本研究只討論前兩類模型的設定方法。
4.3.3.1 Hanemann模型
在封閉式問卷下,調查人員首先選取某個投標值(如A),然后詢問受訪者是否愿意為環境改善支付A。如果受訪者回答“是”,則表明其WTP不小于A;反之若其回答“否”則表明受訪者的真實WTP小于A。
封閉兩分式問卷格式更加具有激勵相容性。與開放式問卷不同,封閉式問卷只能判斷受訪者的WTP是高于A還是低于A,所得到的是受訪者WTP的區間而非精確值。因此,封閉式問卷調查結果并不能直接用來度量WTP或WTA,必須構建計量模型進行估算。
Hanemann(1984)首先提出了以間接效用函數為基礎的CVM估值方法,根據隨機效用函數(Random Utility Function, RUF)討論受訪者的行為偏好。Hanemann認為,對受訪者的行為選擇應該從效用差異的角度進行解釋。例如,評估對象從狀態q0變化至更好的狀態q1,受訪者會根據兩種不同情況下所得到的效用水平來決定是否愿意支付一定的費用。換句話說,受訪者享受環境改善所帶來的效用會大于或等于保持原有消費水平時的效用。
在RUF中,受訪者知道環境狀態變化所帶來的效用改變,但對調查人員來說,每個受訪者的偏好特征是未知的和不確定的。也就是說,受訪的偏好中會包含無法觀測到的隨機成分。這些無法觀測的因素可能源自消費者的特征,或者非市場產品的性質,也可以表示總體成員之間偏好的差異或者度量誤差等。如果受訪者效用的決定因素及其效用函數形式已知,那么就可以很容易地估算出效用大小。然而事實上這是不可能的,因為我們不可能知道所有影響效用的因素,即便知道所有的影響因素,也還需要進一步確定效用函數的形式。
為了更直觀地描述上述邏輯,假定受訪者效用函數中的隨機部分為ε,其間接效用函數設定為v(p, q, y; ε)。若受訪者對環境狀態從q0變化至q1愿意支付費用C,則在Hanemann看來應當滿足

面對C,受訪者回答愿意支付的概率為

為了更直觀地描述上述思想,接下來以McFadden和Leonard(1993)所提出的COX-BOX間接效用函數為例進行闡釋。
定義COX-BOX間接效用函數為

式中,εi是具有可加性且均值為零的隨機擾動項。將式(4-23)代入式(4-22)可得到

其中,y(λ)=(yλ-1)/λ; α=α1-α0; ε=ε1-ε0。
假定ε服從均值為零、方差為σ2的正態分布,可以得到

定義。
將式(4-23)代入式(4-21)求解方程,可以得到平均WTP的表達式為

式中,α≡α1-α0, η≡ε1-ε0。
中位數WTP的表達式為

特別地,當λ=1時效用函數退化為簡單線性形式。此時平均WTP和中位數WTP的計算方法相同:

4.3.3.2 Cameron模型
與Hanemann(1984)所提出的隨機效用模型的思想有所不同,Cameron和James(1987)、Cameron(1988)提出了最小支出函數法,認為可以根據受訪者的支出差異來分析偏好,而無須設定效用函數。在理論本質上,Cameron模型和Hanemann模型并無二致,但在實證研究技術上,Cameron認為兩分選擇數據所提供的信息要比Hanemann模型更為豐富。Cameron認為,在封閉式問卷下受訪者的響應取決于其實際WTP和投標值的大小。如果WTP大于等于所呈現的投標值(A)則會選擇愿意支付,反之則選擇不愿意支付。Cameron的思想顯然更為直觀、簡單易懂。
1.線性模型
封閉式詢價下,受訪者真實WTP無法直接觀察到。設該WTP為受訪者的收入水平、社會經濟變量以及非市場產品特征的函數:

其中zi為協變量向量,γ為其系數向量。ηi服從均值為零的獨立同分布。對隨機抽取的A,受訪者回答“是”的概率等于

假定η服從N(0, σ2),式(4-30)可轉化為


其中,α*=1/σ, β*=γ/σ。
根據式(4-29),線性模型的平均支付意愿和中位數支付意愿的表達式為

若η服從均值為0、方差為π2τ2/3的邏輯斯蒂分布,則式(4-30)轉化為

Λ為邏輯斯蒂函數的累積分布函數。其WTPe和WTPd的計算公式和式(4-32)完全相同。
2.指數模型
若WTP采用指數分布形式,即WTP=exp(Zγ+η),則平均WTP的計算公式為WTP e=exp(Zγ)E(exp(η))。顯然,η的分布形式直接決定了WTPe的估計結果。
若η服從N(0, σ2),則exp(η)服從對數正態分布,其均值為exp(σ2/2),方差為exp(2σ2)-exp(σ2)。代入式(4-30)可以得到

若η服從邏輯斯蒂分布,則有

若η服從Weibull分布,則有

Hanemann方法的基本思想是,受訪者只要知道環境狀態變化前后的效用差異就可以進行理性的決策。Cameron方法則認為,受訪者只有認為投標值小于其真實支付意愿時才會進行決策。相比而言,Cameron方法在計算等價變化或補償變化時更為直觀。McConnell(1990)基于理論模型討論了Hanemann方法和Cameron方法之間的差異。收入變量在封閉式調查中尤為重要。但為了研究方便,文獻通常設定收入的邊際效應為常數。這樣設定包含三重意思:效應是收入的線性函數,收入的邊際效應不隨著資源狀態的變化而變化,收入的邊際效應也因個體不同而不同。McConnell指出,當這三個假設滿足時,Hanemann方法和Cameron方法完全等價。隨后,Park和Loomis(1993)根據實際調查數據檢驗了上述三個約束,結果發現只有第一個得到了印證,其余兩個均被證偽。因此,不能簡單地認為上述兩種方法之間是線性等價變換關系。不過,Park和Loomis也發現,這兩種方法在平均WTP的估計值上非常接近。因此,在實際運用中可根據研究方法的便捷性進行取舍。Hanemann的效用差分模型估計起來更為方便,而Cameron方法則需要采用非線性優化算法,很可能發生迭代過程不收斂的情況。
3.非參數模型
通過前面的分析可以看出,參數模型最大的缺點是需要選取合適的分布函數,但實踐中我們很難先驗地獲知數據的真實生成過程。非參數模型可以避免將過多的精力放在分布函數的選取上。與參數模型相比,非參數模型的估計更容易,并且估計結果不會受概率分布函數的影響。
如前所述,在封閉式問卷下,調查人員只能觀察到受訪者的真實WTP是低于所提供的投標值還是高于所提供的投標值。假定WTP是隨機變量,其累積分布函數為FWTP。受訪者愿意支付費用Ak的概率可表示為
1-FWTP(Ak)為生存函數。常見的生存函數估計方法有Kaplan-Meier-Turnbull(KMT)和Spearman-Karber(SK)兩類。一旦估計出生存函數,根據式(4-37)就可以很容易地得到平均WTP和中位數WTP。

其中,fWTP為WTP的概率密度函數。
不過,正如前面所指出的那樣,WTP應該為有界的非負數。假定WTP的上限為T,則有


在KMT下有

Pk為當投標值為Ak時愿意支付的比例,K為投標點個數,PK+1=0。
在SK下有

其中,定義AK+1=T, PK+1=0。