光遇血海在哪

書名：流域生態(tài)系統(tǒng)恢復(fù)價值評估：CVM有效性與可靠性改進視角
作者名：蔡志堅杜麗永
本章字數(shù)： 15692字
更新時間： 2020-06-05 19:26:41

3.2 CVM的有效性與可靠性

3.2.1 CVM的有效性與可靠性研究

CVM的目的在于獲取消費者對福利變化的真實支付意愿。但調(diào)查可能得到的只是消費者的陳述偏好，對于消費者的陳述偏好能否體現(xiàn)其真實支付意愿需要進一步檢驗。CVM的有效性和可靠性檢驗最早由心理學家提出（Bohrnstedt,1983）。有效性是指CVM結(jié)論是否“準確”，即調(diào)查值與真實值的一致性程度（Freeman,1993）。可靠性強調(diào)的是CVM調(diào)查結(jié)論的“穩(wěn)定性”（Consistency）或“再現(xiàn)性”（Reproducibility）（Kealy et al., 1990）。有效性和可靠性是兩個不同的考核維度，有效性高并不一定表示可靠性高，反之亦然。

3.2.1.1 CVM的有效性

CVM的有效性包括內(nèi)容有效性（Content Validity）、標準有效性（Criterion Validity）以及建構(gòu)有效性（Construct Validity）三類。

1．內(nèi)容有效性

內(nèi)容有效性是指問卷能否恰當?shù)匾龑茉L者表述其真實WTP。例如，受訪者是否理解所調(diào)查的內(nèi)容，是否對CVM場景中的關(guān)鍵環(huán)節(jié)特別敏感（如支付工具）。內(nèi)容有效性檢驗主要集中在問卷設(shè)計、調(diào)查手段以及抽樣方法等方面。對內(nèi)容有效性的檢驗應(yīng)該放在正式調(diào)查之前進行，在問卷設(shè)計中應(yīng)注意借鑒其他領(lǐng)域（如經(jīng)濟學、管理學、社會學和心理學）內(nèi)的專家的意見。

應(yīng)當指出的是，問卷設(shè)計和調(diào)查過程本身就不可避免地帶有主觀性，內(nèi)容有效性問題始終都存在。實際上，只要調(diào)查問卷正確且描述清楚，通常就都會認為內(nèi)容是有效的（唐增、徐中民，2008）。提高內(nèi)容有效性的常見檢驗方法有可視化幫助（Visual Aids）、面對面采訪、多輪預(yù)調(diào)查等。

2．標準有效性

標準有效性是指CVM的評估結(jié)果能否如實反映所調(diào)查對象的“真實”價值，有時也被稱作外部有效性（External Validity）。理論上，標準有效性是鑒別效果最好的有效性檢驗方法，因為它將調(diào)查結(jié)果與真實結(jié)果進行對照。進行標準有效性討論的關(guān)鍵在于設(shè)定一個“標準”，這個標準可以是真實的市場價格，也可以是實際的支付行為。就私人產(chǎn)品或定義明確的非使用價值而言，較容易設(shè)定相應(yīng)的“標準”。但是，當調(diào)查對象為公共品或者定義不明確的非使用價值時，基本上不存在這樣的市場和價格，也很難有實際的支付行為作為參考。此時，研究者一般通過構(gòu)建假想的模擬市場來進行標準有效性討論。但這樣一來，又很難保證模擬市場所得到的“價值”就一定是那個“真實”的價值。

3．建構(gòu)有效性

標準有效性過于理想化，可操作性不強。研究者又提出了建構(gòu)有效性檢驗標準。建構(gòu)有效性包括收斂有效性（Convergent Validity）和理論有效性（Theoretical Validity）兩類。理論有效性也被稱作內(nèi)部有效性。

所謂收斂有效性是指利用不同評估方法（如TCM、CVM、HPM等）或不同詢價技術(shù)（如開放式問卷、封閉式問卷等）對研究對象進行價值評估，并分析其估計結(jié)果在統(tǒng)計上是否存在差異。理論有效性是指研究結(jié)論是否與理論預(yù)期相符。例如，如果環(huán)境服務(wù)對受訪者而言是正常品，那么按照經(jīng)濟學理論，投標值越高受訪者的WTP會越低；又例如，受訪者收入越高，預(yù)期其WTP也應(yīng)越高。理論有效性檢驗并不能告訴我們偏差究竟有多大，但可能幫助我們找出影響偏差的因素。

WTP/WTA偏差也是理論有效性檢驗的重要內(nèi)容之一。研究發(fā)現(xiàn)，在CVM下，WTP和WTA的估計會存在顯著差距（Horowitz and McConnell,2002）。理論有效性的另外一個重要內(nèi)容是進行范圍敏感性檢驗（Scope Test），即確定WTP是否隨評估對象的變化（包括質(zhì)量或數(shù)量）而發(fā)生符合理論預(yù)期的變化。具體又可分為內(nèi)部范圍檢驗（Internal Scope Test）和外部范圍檢驗（External Scope Test）。外部范圍檢驗是指就同一評估對象的兩種不同供給水平（數(shù)量或質(zhì)量）詢問不同的人群，以觀察兩類群體在WTP上是否存在差異。而內(nèi)部范圍檢驗是指向同一受訪者提供兩種不同的供給水平（數(shù)量或質(zhì)量），然后觀察兩種情形下的WTP是否存在差異。

3.2.1.2 CVM的可靠性

CVM的可靠性（Reliability）是指WTP的變異程度在多大程度上是由隨機誤差所造成的。換言之，可靠性強調(diào)CVM結(jié)論的可再現(xiàn)性和穩(wěn)定性。進行時間可靠性檢驗的意義在于，由于政策的影響具有長期性，因此必須對評估結(jié)論的跨期穩(wěn)定性進行研究，以便進行更為科學的成本收益估算。

1．回歸方程的R2

R2是評價評估結(jié)果可靠性的指標之一。R2越低表明誤差越高，可能是問卷設(shè)計不合理或者估計模型錯誤造成的。Mitchell等認為如果R2小于0.15的話就表明估計結(jié)論的可靠性較差（Mitchell R. C., Carson R. T., 1989）。因此，在解釋變量的選擇上需要更為謹慎，因為不同的解釋變量組合所得到的結(jié)論可能不同，不僅會質(zhì)疑理論有效性，而且還會影響到R2的大小。不過，R2指標更適用于開放式、支付卡式詢價方法，因為這類數(shù)據(jù)為連續(xù)數(shù)據(jù)，進行普通最小二乘估計即可。而在封閉式兩分式下所得到的數(shù)據(jù)為離散數(shù)據(jù)，經(jīng)典的計量模型并不適用，R2也就失去了原有的意義。盡管還可以選取McFadden-R2, Pseudo-R2或者極大似然比率等其他衡量指標進行評價，但這些指標的直觀含義較之于經(jīng)典計量模型要模糊得多。

2．時間穩(wěn)定性

時間穩(wěn)定性（Temporal Consistency）指在不同時點上用同一調(diào)查方式對不同樣本進行調(diào)查，如果前后兩次WTP基本一致則表明穩(wěn)定性較好。但環(huán)境系統(tǒng)是一個動態(tài)系統(tǒng)，如果評估時間不同，那么原來的待評估對象可能發(fā)生變化。進行時間穩(wěn)定性檢驗的另外一個未解決的問題是時間間隔。間隔過短會影響第二次調(diào)查的獨立性，間隔太長則受訪者的經(jīng)濟社會特征會發(fā)生較大變化（董雪旺等，2011）。

3．檢驗—復(fù)檢驗

檢驗—復(fù)檢驗（Test-retest）是用同樣的問卷和調(diào)查方式對同一樣本在相隔一段時間后進行再次調(diào)查，以檢驗前后兩次調(diào)查的結(jié)論是否一致。不過，由于調(diào)查時間不同，再次調(diào)查時很難跟蹤到參與第一次調(diào)查的全部受訪者。即便跟蹤到原先的受訪者，其社會經(jīng)濟特征也可能已經(jīng)隨著時間推移發(fā)生了變化。換句話說，在進行檢驗—復(fù)檢驗時，我們可能很難找到完全相同的調(diào)查樣本，有時候只能抽取相似的樣本。此外，與時間穩(wěn)定性檢驗類似，檢驗—復(fù)檢驗同樣面臨著時間間隔選取問題。因此，嚴格的檢驗—復(fù)檢驗的可操作性并不高，更適合在實驗室進行。

可靠性衡量的是可比性（不同個體間、同一個體在不同時間上的差異），與有效性不同，它并不涉及估值結(jié)果是否是估值物品的真實價值。可靠性的問題主要源自兩個方面：調(diào)查取樣過程和統(tǒng)計分析過程。所以，通常有兩種方法可以提高有效性：一是更大的樣本容量；二是采用更有效的統(tǒng)計技術(shù)處理“奇異值”。奇異值指的是過于極端的回答，它會顯著影響估計結(jié)果。

4．平行檢驗法

無論是時間穩(wěn)定性檢驗還是檢驗—復(fù)檢驗，其所面臨的最大問題是調(diào)查成本過高。一種替代方法是在同一份問卷中提供兩組不同的詢價技術(shù)，即平行檢驗（Parallel Test）。例如，在封閉式問題結(jié)束后，可以再提供一個開放式問題，直接詢問受訪者的支付意愿。如果兩種方法在估計結(jié)果上具有很好的可比性，則表明檢驗結(jié)論較為可靠。但平行檢驗方法的最大缺點是無法保證第一次詢價是否會影響到第二次詢價。

3.2.1.3 WTP/WTA差異

度量消費者剩余有兩個指標：補償變化（Compensation Variation, CV）和等價變化（Equivalent Variation, EV）。當價格下降的時，CV表示使個人效用保持在最初水平下的貨幣收入變化量，因此它是價格下降時個人支付的最大數(shù)值，它代表一種支付意愿（Willingness to Pay, WTP），EV是使個人效用保持在價格下降后的效用水平上的貨幣收入變化量，因此它是為替代價格下降的個人所接受的最小補償量，它代表一種補償意愿（Willingness to Accept, WTA）。當價格上升時，CV表示個人的最大意愿補償值（WTA），而EV表示個人最大意愿支付值（WTP）。

根據(jù)標準的福利經(jīng)濟學理論，如果收入和財富效應(yīng)相同，則WTP和WTA在數(shù)值上應(yīng)大致相當。Willig證明在完全競爭的私人市場下，產(chǎn)品的收入彈性不大時（即產(chǎn)品的消費支出占消費者的收入比例較小），WTP與WTA在估值上會非常接近（E. G. Willig,1976）。

然而，理論上的推斷似乎并沒有得到經(jīng)驗數(shù)據(jù)的支持。大量研究顯示，WTA要明顯大于WTP。Brown等對水鳥捕獵權(quán)的研究發(fā)現(xiàn)，WTP為247美元而WTA卻高達1044美元（Brown and Hammack ,1973）。Cummings等對15篇論文進行歸納后發(fā)現(xiàn)，平均而言，WTA是WTP的1.5～16.6倍（Cummings et al., 1986）。而Horowitz等對208個研究案例進行整理后發(fā)現(xiàn)，平均而言，WTA約為WTP的7倍（Horowitz and McConnell,2002），并且隨著產(chǎn)品類型的不同，WTP和WTA之間的比率存在差異，非市場產(chǎn)品的比率約為10.4，正常品的比率約為2.9，而對貨幣進行評估時，二者間的比率為2.1。通過構(gòu)建回歸模型，Horowitz等發(fā)現(xiàn)，WTP/WTA比率主要受到產(chǎn)品的類型（是公共品還是私人品）的影響。但與常識不同的是，他們發(fā)現(xiàn)WTP/WTA比率與市場是真實的還是假想的無關(guān)。同時，在采用激勵相容調(diào)查技術(shù)的研究中，WTP/WTA比率會更大而不是像早期的研究所認為的更低。這一發(fā)現(xiàn)的含義是，將假想市場轉(zhuǎn)向?qū)嶒炇铱赡懿⒉粫s小二者間的差距。同時，受訪者對調(diào)查內(nèi)容的熟悉程度并不會影響WTP/WTA比率（Horowitz and McConnell, 2002）。據(jù)此，Horowitz等認為，WTP和WTA之間的差異可能更多地受受訪者的廣義偏好（Broad-based Preference）影響。據(jù)此，批評者認為CVM有悖于新古典消費理論，因而在測度福利水平上并不可取（Diamond,1996）。

面對WTP和WTA之間如此巨大的差距，學術(shù)界試圖從問卷設(shè)計、調(diào)查手段、經(jīng)濟學和心理學等視角進行解釋。從解釋力來看，基于收入效應(yīng)、替代效應(yīng)以及稟賦效應(yīng)的解釋最具有說服力。其他不太常見的解釋包括隱含價值（Implied Value）、產(chǎn)權(quán)理論（Property Rights）、交易費用（Transaction Costs）、利益驅(qū)動（Profit Motive）、合法性（Legitimacy）、不確定性（Ambiguity）、責任不對稱（Responsibility）、熟悉度（Familiarity）等。參見Brown（1999）、Venkatachalam（2004）、趙軍等（2007）以及張翼飛和趙敏（2007）的總結(jié)。在Hanemann等看來，WTP和WTA之間的差異不僅取決于收入效應(yīng)，而且會受到替代效應(yīng)的影響。產(chǎn)品的可替代性越弱，二者間的差異就越顯著。極端情況下，如果產(chǎn)品完全不存在替代品，那么雖然WTP也會很大，但其上限要受到收入水平的制約。相反，在WTA下由于沒有收入可以補償產(chǎn)品數(shù)量減少所造成的損失，因而其取值趨近于無窮大（Hanemann et al., 1991）。Hanemann等進一步指出，較之于傳統(tǒng)產(chǎn)品，環(huán)境產(chǎn)品的可替代性極弱，因此針對環(huán)境產(chǎn)品的WTP和WTA會相差更大。Shogren等在隨后進行的一項實證研究中也證實了這一判斷（Shogren et al., 1994）。

與經(jīng)濟學解釋視角不同，一些心理學家則強調(diào)稟賦效應(yīng)（Endowment Effect）的作用。稟賦效應(yīng)是指個體在擁有某物品時對該物品的估價高于沒有擁有該物品時的估價的現(xiàn)象。Thaler首次提出了稟賦效應(yīng)這一概念，認為稟賦效應(yīng)導致了WTA與WTP之間的差異（Thaler, 1980）。在Thaler（1980）所舉的一個經(jīng)典的稟賦效應(yīng)例子中，研究者向被試呈現(xiàn)了如下兩個情境：其一，假設(shè)在一周內(nèi)你有0.001的概率感染一種疾病，如果感染的話，會很快且無痛苦地死去，那么你最多愿意花多少錢來治愈這種疾病？二，假設(shè)某項研究需要志愿者，同樣有0.001的概率感染這種疾病，如果你參加這項研究，你要求研究者最少付給你多少錢？結(jié)果發(fā)現(xiàn)，被試在兩種情境中所給出的貨幣量并不一致，第一種情境中被試給出的價格是200美元，而第二種情境中則是1000美元。在第二種情境中，因為被試將自己所擁有的健康看做一種稟賦，對其評價更加積極，從而導致被試提高對其的估價，所以產(chǎn)生稟賦效應(yīng)（轉(zhuǎn)引自劉騰飛等，2010）。在稟賦效應(yīng)產(chǎn)生的原因上，心理學家將這種差別歸因于損失規(guī)避（Loss Aversion）、前景理論（Prospect Theory）和自尊等原因。其中，損失規(guī)避指人們對損失的痛恨程度往往大于相同的收益所帶來的喜悅程度。前景理論是指人們更傾向于維持現(xiàn)狀的一種心理狀態(tài)。另外一種基于心理學視角的解釋是“謹慎消費假說”（Mitchell and Carson,1989）。根據(jù)這一假說，家庭通常沒有時間去搜集所調(diào)查的環(huán)境產(chǎn)品足夠多的數(shù)據(jù)信息來優(yōu)化自己的決策，因此在真實價值上總是存在不確定性。為了謹慎起見，與信息完全完備時相比，理性的家庭通常會低估WTP而高估WTA。

除此以外，不少研究者還認為熟悉程度也會對WTP/WTA偏差產(chǎn)生影響（如Cummings et al., 1986; Shogren et al., 1994）。例如Coursey等發(fā)現(xiàn)，隨著重復(fù)實驗的次數(shù)增多，WTP/WTA偏差逐漸縮小（Coursey,1987）。具體而言，在多次實驗后，WTP基本保持穩(wěn)定，但是WTA在數(shù)值上下降得非常快。因此，造成WTP/WTA偏差的另外一個原因可能在于受訪者沒有足夠的時間優(yōu)化自己的決策。

理論上，WTP及WTA雖均可用來評估自然資源的價值，但兩者的含義與實際金額卻不一定相同。WTP與WTA具有不對稱的價值取向（Kahneman and Tversky,1979），消費者面對不確定因素或者進行風險規(guī)避考慮時也會出現(xiàn)取舍上的差異。同時，受訪者對于補貼金額通常會持“多多益善”的態(tài)度，而對于支付價格則趨于謹慎，越少越好（Bishop and Heberlein,1979; Cummings et al., 1986）。Hanemann（1984）認為WTP不可能超過受訪者的收入水平，而WTA則存在無限大的可能。綜合這些因素，并考慮到CVM所評估的對象通常可替代性較弱，因此單就實證研究技術(shù)而言，采用WTP估算非市場產(chǎn)品價值更為妥當（Cummings et al., 1986; Arrow et al., 1993）。

3.2.1.4 范圍敏感性

范圍敏感性問題最早由Kahneman（1986）提出。在埃克森石油泄漏事件后，范圍檢驗成為CVM領(lǐng)域內(nèi)的研究焦點之一。Arrow等（1993）更是指出：“范圍敏感性是檢驗CVM可信度最重要的標準。”

范圍效應(yīng)是指受訪者的WTP并不會隨著評估對象的數(shù)量或質(zhì)量變化而改變。范圍效應(yīng)在不同場合也被稱為嵌入效應(yīng)（Embedded Effect）、以偏概全偏差（Part-whole Bias）、次加總效應(yīng)（Subadditivity Effect）、象征偏差（Symbolic Bas）等（Kahneman and Knetsch,1992）。盡管這些概念所考察的側(cè)重點不同，但在本質(zhì)上沒有太大差別（Boyle et al., 1994）。例如，受訪者對河流A單獨進行評估與對整個區(qū)域內(nèi)所有河流進行評估的WTP在數(shù)值上可能相差不大。又例如，受訪者對河流A的水質(zhì)從劣Ⅴ類改善到Ⅲ類與從劣Ⅴ類改善到Ⅱ類的評估結(jié)果也可能差別不大。范圍檢驗可分為內(nèi)部范圍檢驗（Internal Scope Test）和外部范圍檢驗（External Scope Test）。外部范圍檢驗是比較分離樣本（Split-sample）的WTP的差異。外部檢驗由于忽略了受訪者在個體特征上的差異，因此對同一樣本進行內(nèi)部范圍檢驗更加具有說服力。

范圍不敏感被認為是CVM的重要缺陷之一（如Diamond and Hausman,1994; Boyle et al., 1994）。早期進行的研究中，Kahneman等提供了三種逐層嵌套的公共品（A包含B, B又包含C），結(jié)果發(fā)現(xiàn)受訪者對A、B、C的WTP依次為139.91美元、151.6美元、122.64美元。據(jù)此Kahneman等人認為，受訪者在CVM下如何作答和非市場產(chǎn)品的價值無關(guān)，僅僅反映受訪者對“道德滿足感”（Moral Satisfaction）的購買（Kahneman and Knetsch,1992）。

與Kahneman等人的研究思路略有不同，Diamond等（1993）和Desvousges等（1993）就同一評估對象的不同供給水平進行了范圍檢驗，結(jié)果同樣發(fā)現(xiàn)了范圍不敏感。Mitchell等認為，造成CVM范圍效應(yīng)的原因之一可能在于其評估對象是非使用價值（Mitchell and Carson,1989）。不過這一觀點很快受到了Kahneman等（1992）的批評：即使在評估私人產(chǎn)品時，CVM同樣存在范圍不敏感問題。

但是也有學者指出，范圍不敏感并不意味著CVM與需求理論是相悖的。例如，Rollins和Lyke（1998）就認為范圍不敏感也可能是邊際價值遞減造成的。對于自然保護區(qū)這類公共品而言，受訪者更為關(guān)心的可能是“有”還是“沒有”的問題。繼續(xù)提高公共品的數(shù)量或質(zhì)量所帶來的效用雖然為正，但在邊際變化上不會太明顯。Randall和Hoehn（1996）則發(fā)現(xiàn)，即使是人們在現(xiàn)實生活中進行私人產(chǎn)品消費決策時，也可能存在范圍不敏感問題。Hanley等（1995）認為范圍不敏感可能是因為評估對象過于復(fù)雜，受訪者無法辨別其數(shù)量或質(zhì)量的變化究竟是顯著的還是不顯著的。但這種擔心似乎是多余的，Veisten等（2004）的研究則發(fā)現(xiàn)，即便在評估較為復(fù)雜的對象（如生物多樣性）時，CVM也可以通過范圍敏感性檢驗。

最近的一系列研究則提供了更為積極的信號。Smith和Osborne（1996）根據(jù)5篇有關(guān)空氣可見度的研究文獻進行Meta分析后發(fā)現(xiàn)，受訪者對空氣質(zhì)量的變化非常敏感。Carson等（1997）發(fā)現(xiàn)，有30多篇文獻通過了范圍檢驗，約占80%，那些未通過顯著性檢驗的文獻具有如下共性：（1）樣本量較小；（2）問卷設(shè)計質(zhì)量不高；（3）調(diào)查手段主要為郵件調(diào)查或電話調(diào)查。

Heberlein等（2005）最近的一項研究顯示，熟悉程度是影響范圍效應(yīng)的重要因素：一是當受訪者對“部分”了解更多，或者更加喜歡“部分”，或者對“部分”有過消費經(jīng)歷時，其會傾向于高估“部分”的價值；二是當受訪者對“整體”和“部分”都比較熟悉，或者都具有明確的偏好，或者都曾經(jīng)有過消費經(jīng)歷時，CVM完全能夠保證范圍敏感性。其中的邏輯是，受訪者如果對評估對象不熟悉，就會“構(gòu)建”（Construct）自己的偏好。在構(gòu)建偏好假設(shè)下，受訪者不會根據(jù)既有的偏好進行決策，而會根據(jù)問題框架進行啟發(fā)式推理（Heuristic Cues），從而導致決策偏誤（Tversky and Kahneman,1974）。

CVM在研究私人產(chǎn)品時，基本能夠保證范圍敏感性，但在研究公共品時，尤其是在研究較為陌生的公共品時，則會存在不同程度的范圍不敏感問題。綜合起來，造成范圍不敏感的原因可歸納為三點：

（1）統(tǒng)計檢驗的功效問題。例如Diamond等（1993）在檢驗人們對野生動物保護區(qū)的不同保護強度的WTP是否存在差異時，得到統(tǒng)計檢驗的P值為0.42（原假設(shè)為WTP相等）。

（2）問卷設(shè)計和調(diào)查實施問題。例如問卷對評估對象“部分”和“整體”的區(qū)別沒有界定清楚，即便受訪者清楚“部分”和“整體”的區(qū)別，也可能存在搭便車的心理。當然，也可能是二者間的區(qū)別過于復(fù)雜導致受訪者很難理解。

（3）公共品的邊際效應(yīng)下降很快，受訪者一旦支付過就不愿意多支付（Carson et al., 2001）。

因此，范圍不敏感問題可以通過合理的問卷設(shè)計和調(diào)查方式緩解。例如，采用面對面訪談的方式，盡可能讓受訪者理解評估內(nèi)容，同時要讓受訪者相信項目是真實可信的，并營造寬松的氛圍，降低受訪者的道德滿足感。

3.2.1.5 收斂（標準）有效性

收斂（標準）有效性的檢驗方法主要有4種：一是將CVM估計結(jié)果和間接估計結(jié)果進行對比（如TCM、HPM）；二是將CVM的結(jié)果和實際市場交易結(jié)果對比；三是通過模擬市場，將CVM組和實際支付組進行對比；四是將假想市場行為和實際投票行為進行對比。其中，應(yīng)用最廣泛的是前三種方法。但第一種方法只能用來評估市場產(chǎn)品，因為非市場產(chǎn)品是無法進行真實交易的。表3-1對涉及標準有效性或收斂有效性討論的部分文獻進行了歸納。

表3-1 CVM有效性與可靠性檢驗文獻匯總

通過對比可以發(fā)現(xiàn)，由于在評估對象的性質(zhì)（私人產(chǎn)品還是公共產(chǎn)品）、受訪者對評估對象的熟悉程度（使用價值還是非使用價值）以及詢價方式（開放式還是封閉式）等因素上的差異，現(xiàn)有研究結(jié)論可謂見仁見智。即便是基于同一實驗數(shù)據(jù)，由于估計方法的不同，也可能得到完全相反的結(jié)論，具體可參見Cummings等（1997）和Haab等（1999）的討論。因此，真正值得進一步研究的課題不是存在或者不存在差異，而是哪些因素會造成估計結(jié)果出現(xiàn)偏差。從目前國內(nèi)外的研究成果來看，這個問題并沒有被解釋清楚。

3.2.2 CVM有效性和可靠性的影響因素

3.2.2.1 熟悉程度

真實的熟悉程度是保證受訪者提供有意義的回答的重要前提（如Desvousges et al., 1993）。熟悉程度高有助于受訪者更好地理解調(diào)查項目，提高項目實施的簡便性和WTP估計結(jié)果的精確性。其中的邏輯是，只有消費者有過直接的消費經(jīng)歷才能形成明確的經(jīng)濟學意義上的偏好。而在CVM的實際運用中，受訪者對待評估對象有過直接消費經(jīng)歷的可能性卻較低，尤其是在評估非市場價值（如生物多樣性）或非使用價值時（如存在價值）。

信息包括外生信息和內(nèi)生信息（Cameron,1997）。受訪者本身具有的經(jīng)歷稱為內(nèi)生信息（或稱之為熟悉程度），調(diào)查過程中所提供的信息稱為外生信息。熟悉程度可能源自受訪者的直接經(jīng)歷，也可能源自間接經(jīng)歷（如從媒體、親友處獲知）。首先我們討論熟悉程度的影響，外生信息的影響將在后面展開討論。

Whitehead等根據(jù)熟悉程度的不同將受訪者分成三類：現(xiàn)場使用者、非現(xiàn)場使用者和非使用者。根據(jù)Whitehead等（1995），現(xiàn)場使用者指有過使用經(jīng)歷的受訪者，例如有過長江游憩經(jīng)歷等；非現(xiàn)場使用者是指通過媒體渠道了解或討論過評估對象的受訪者，表明他們對此較為關(guān)心；非使用者指在問卷調(diào)查之前從未聽說過評估對象的受訪者。結(jié)果發(fā)現(xiàn)，現(xiàn)場使用者和非現(xiàn)場使用者的價格和收入變量在影響方向上符合理論預(yù)期，而對于非使用者上述結(jié)論并不成立（Whitehead et al., 1995）。據(jù)此，Whitehead認為如果受訪者在調(diào)查前缺乏經(jīng)驗知識，就會降低CVM的有效性和可靠性。類似地，Cameron（1997）在一項對鱒魚豐裕度的研究中發(fā)現(xiàn)，之前有過垂釣經(jīng)歷的受訪者其WTP的精確性更高。在一項關(guān)于水鳥保護支付意愿的研究中，Boyle等（1994）發(fā)現(xiàn)，狩獵者的支付意愿要明顯高于非狩獵者。Turpie（2003）在一項對南非的生物多樣性價值評估研究中，進一步區(qū)分了知識（Knowledge）、經(jīng)歷（Experience）和興趣（Interest）等因素對WTP的影響。結(jié)果發(fā)現(xiàn)，WTP和受訪者的經(jīng)歷（參觀的頻次）關(guān)系不大，而和知識、興趣之間具有顯著的正相關(guān)性。

CVM的批評者普遍認為，對于缺少直接消費經(jīng)歷的產(chǎn)品，受訪者不可能形成明確的偏好。但標準的微觀經(jīng)濟學理論并沒有強調(diào)消費經(jīng)歷是理性決策的先決條件（Carson et al., 2001）。實際上，消費經(jīng)歷僅僅是影響消費決策的諸多因素中的一個，其還可能通過媒體、口碑等途徑傳遞。此外，即使缺乏消費經(jīng)歷，但如果受訪者認為評估對象確實重要，那么受訪者同樣會做出理性的決策。實際上，在現(xiàn)實生活中，常常會有一些消費者從未使用過或并不熟悉的新產(chǎn)品推出，但這絲毫沒有影響人們進行理性的消費決策。因此，一個值得研究的問題是人們面對陌生產(chǎn)品或者不確定性時是怎樣進行決策的。

本研究采取的應(yīng)對措施如下：通過兩組可視化輔助手段強化受訪者對調(diào)查對象的感性認識。

3.2.2.2 詢價方法偏差

CVM常見的詢價方法包括逐步競價法（Bidding Game）、開放式（Open-ended）詢價、支付卡式（Payment Card）詢價以及封閉兩分式（Closedended Discrete Choice）詢價。其中封閉兩分式常見的有單邊界（Single Bounded）、雙邊界（Double Bounded）兩種。近年來，學術(shù)界又提出了三邊界（如Bateman et al., 2001）、多邊界（如Welsh and Gregory,1998）、1.5邊界（如Bateman et al., 2009）等其他詢價方法。不過，這些詢價方法目前尚未被學術(shù)界廣泛運用。

（1）逐步競價法。研究者首先選定初始投標值，然后詢問受訪者是否愿意支付。若回答“是”，則提高金額繼續(xù)詢問直到受訪者不愿意為止；反之，若受訪者回答“否”，則降低金額繼續(xù)詢問直到受訪者愿意為止。最后一次回答“是”時所對應(yīng)的投標值即為受訪者的最大WTP。

（2）開放式詢價。開放式詢價是最直接的詢價方式，指調(diào)查人員事前并不提供任何價格范圍的參考信息，而是讓受訪者憑主觀感受來陳述其最高WTP。

（3）支付卡式詢價。支付卡向受訪者提供一組數(shù)字，讓受訪者圈選出自己心中滿意的答案。從提問方式來看，支付卡分為四類：1）直接圈選出愿意支付的數(shù)值；2）圈選出WTP的最低值；3）圈選出WTP的最高值；4）圈選出WTP的區(qū)間。

（4）封閉兩分式詢價。封閉兩分式詢價主要有單邊界兩分式和雙邊界兩分式兩種形式。在單邊界兩分式下，研究者就所評估對象詢問受訪者是否愿意支付某一隨機金額（A），受訪者只需回答“是”或“否”。在單邊界問卷下，研究者只能獲取受訪者的WTP是否高于A這一有限信息。雙邊界詢價方法是對單邊界的進一步擴展。具體實施原則是：受訪者在第一輪封閉式問題中若回答“是”，則提高金額繼續(xù)詢問；反之，若受訪者在第一輪中回答“否”，則降低金額再詢問一次。

詢價方法評估結(jié)果不收斂是CVM被批評的主要原因之一（Hausman,1993）。為了檢驗詢價方法是否會對價值估算產(chǎn)生影響，學術(shù)界進行了一系列有益的探討。例如，Bateman等（1995）通過比較開放式、封閉單邊界和逐步競價法下WTP的影響因素發(fā)現(xiàn)，受訪者在回答開放式問卷時不確定性最高。Brown等（1996）對11篇文獻進行了歸納，發(fā)現(xiàn)封閉式詢價所估算出的WTP是開放式的1.12～4.78倍。造成這類偏差的原因一方面在于受訪者在封閉式詢價下可能存在“隨聲附和”（Yea-saying）現(xiàn)象，另外一方面在于偏好的不確定性（Ready et al., 1996; Brown et al., 1996）。Cameron等（2002）在一項對環(huán)境保護支付意愿的研究中發(fā)現(xiàn)，WTP估值結(jié)果從大到小排序是封閉兩分式＞支付卡式＞開放式。但Blaine等在對廢棄物回收利用的研究中同樣證實了Cameron等人的發(fā)現(xiàn)：封閉式詢價方法的估計值要大于支付卡式（Blaine et al. 2005）。

本研究采取的應(yīng)對措施如下：設(shè)計了開放式、支付卡式、封閉式單邊界以及封閉式雙邊界四組詢價方法進行綜合比較，以便篩選出符合經(jīng)濟學意義、可通過統(tǒng)計學檢驗且政策實踐操作性強的估值結(jié)果。

3.2.2.3 調(diào)查方法偏差

常用的調(diào)查方法包括當面調(diào)查、電話調(diào)查和郵寄調(diào)查三種。近年來，隨著互聯(lián)網(wǎng)的興起，利用網(wǎng)絡(luò)問卷的調(diào)查方式也逐漸被學界采用。調(diào)查方法對CVM的影響主要有四種可能（Ethier et al., 2000）：第一，抽樣偏差；第二，社會認可偏差（Social Desirability Bias）；第三，親和力偏差（Avidity Bias）；第四，響應(yīng)率偏差。例如，網(wǎng)絡(luò)調(diào)查的對象只能是具備上網(wǎng)條件的公眾，從而人為地排除了一些樣本，造成了抽樣偏差。在電話調(diào)查或當面調(diào)查中，受訪者可能會基于社會責任的考慮，給出有悖于自己真實想法的回答，造成社會認可偏差。親和力偏差是指對調(diào)查內(nèi)容感興趣的受訪者更愿意參與調(diào)查。響應(yīng)率偏差是指受訪者終止調(diào)查的可能性。

本研究采取的應(yīng)對措施如下：考慮到我國的文化習俗和西方國家的差異，采用當面調(diào)查方式，同時注意避免調(diào)查員偏差。

3.2.2.4 策略性偏差

策略性偏差是指受訪者擔心調(diào)查結(jié)果將來會被用來制定政策，影響到自己的效用水平，從而刻意不陳述其真實偏好，以期影響調(diào)查結(jié)果。常見的原因有搭便車、謹慎偏差、過度承諾、奉承偏差等（董雪旺等，2011）。例如，受訪者如果認為自己陳述多少就要支付多少，在搭便車的心理下就會故意降低自己的支付意愿。相反，如果受訪者確信環(huán)境服務(wù)肯定會提供，即使自己不支付也會由別人支付，就可能存在高估。受訪者也可能為了顯示自己的“社會責任感”而奉承調(diào)查人員，故意高估自己的支付意愿。策略性偏差在實際調(diào)查中很難檢測出來，要完全避免策略性偏差是極為困難的。不過，一些學者通過實驗發(fā)現(xiàn)，策略性偏差可能并沒有想象的那么大（Garrod and Willis,1999）。

本研究采取的應(yīng)對措施如下：由于在開放式和支付卡式詢價方法下，受訪者采取策略性行為的可能性更高，因此在第三輪大尺度調(diào)查中采用封閉式詢價方法進行調(diào)查。對完成詢價問題的受訪者均追問其愿意支付或拒絕支付的原因，以此判斷其支付意愿是否真實可信。剔除支付意愿超過家庭年收入水平5%的受訪者。提醒受訪者將調(diào)查問題的真實性和政策性區(qū)分開來。為了避免因受訪者對支付工具不滿而造成的策略性響應(yīng)，讓受訪者自行選取其心儀的支付工具。

3.2.2.5 假想市場偏差

假想市場偏差（簡稱為假想偏差）指受訪者在假想市場中的支付與在真實市場中的支付不一致。這種偏差源自CVM調(diào)查對虛擬市場的構(gòu)建。傳統(tǒng)觀點認為，由于這樣的市場是虛擬的，因此受訪者不會認真對待，其回答未必能反映真實情形。研究發(fā)現(xiàn)，熟悉程度是造成假想偏差的重要原因之一（Michell and Carson,1989）。此外，評估對象的性質(zhì)也是影響假想偏差的重要因素。例如相比私人產(chǎn)品，CVM對公共品進行價值評估時更傾向于造成高估。List和Gallet（2001）、Murphy（2005）還指出，詢價方法是造成假想偏差的主要原因。此外，在進行假想偏差檢驗時，現(xiàn)有研究大都是以學生為實驗對象，這也可能是偏差的一個來源。

應(yīng)對假想偏差有三種手段：事前處理（Ex ante）、事后處理（Ex post）或者采用不協(xié)調(diào)性最小化（Dissonance Minimize, DM）問卷。廉價磋商（Cheap Talk）就是一種使用最廣泛的事前處理方法，這種方法起源于實驗經(jīng)濟學，其核心思想是在調(diào)查之前提醒受訪者可能存在假想偏差、造成假想偏差的原因（如替代品信息、預(yù)算約束等）。

事后處理是在受訪者回答愿意支付后，追問其對該支付的決心程度（或稱之為不確定性量表法）。例如，采用量表的方式詢問受訪者是肯定愿意支付該金額還是不太確定，然后根據(jù)受訪者的不同態(tài)度對其支付意愿進行調(diào)整。

DM問卷源于如下事實：封閉式問卷會將受訪者置于兩難的境地——是如實回答愿意或不愿意支付，還是僅就支持與否表明態(tài)度？例如，盡管受訪者對評估對象的偏好為正，但問卷所提供的投標值可能過高。DM問卷的核心思想是增加一個問題選項，將受訪者是否支持該項目的態(tài)度和支付金額的大小兩種情況區(qū)分開來。例如，可以提供“雖然我支持這個項目，但對我來說它并不值50元”“雖然我支持這個項目，但我付不起50元”之類的選項。

上述三種方法中，廉價磋商和不確定性量表法使用得更為普遍。有關(guān)這兩種方法的詳細討論將在本研究第十三章展開。

本研究采取的應(yīng)對措施如下：根據(jù)DM原理，將消費決策過程區(qū)分為“加入決策”和“支付決策”兩個階段，以區(qū)別受訪者的心理動機。在進行價值估算時，分別采用廉價磋商和不確定性量表法對受訪者的響應(yīng)進行校正。

3.2.2.6 支付工具偏差

常見的支付工具有自由捐款、繳稅（如環(huán)境稅、收入稅等）、成立基金會募款、義工、提高水電費、提高相關(guān)產(chǎn)品的價格（如許可證）等形式。支付工具的可行性和真實性會影響受訪者的WTP。例如，自愿捐款不具有激勵相容性，再加上市場的假想性，會造成受訪者傾向于給出過高的評價值（Caron,1997）。或者受訪者覺得當前的稅負太重，從而排斥稅收手段，造成低估。由于文化習慣不同，發(fā)展中國家的公眾可能具有不同的支付工具偏好。一些強制性支付手段容易造成受訪者的反感，如征收環(huán)境稅等。就支付方式而言，常見的有一次性支付、按月支付和按年支付。一次性支付主要適用于評價偶發(fā)性事件，而按月支付過于頻繁，容易造成支付意愿不足。相比之下，以每戶每年為預(yù)算約束單位更易被受訪者接受。此外，支付年限的選取也應(yīng)該予以重視，通常為5年或10年。

本研究采取的應(yīng)對措施如下：提供日常生活中常見的或較為熟悉的捐款、繳納生態(tài)稅、提高水價以及存取基金（像繳納社會保險金一樣，從工資賬戶中定期扣除）等幾類支付工具，同時以家庭為支付單位，支付年限選取5年。

3.2.2.7 零響應(yīng)偏差

零響應(yīng)是指問卷調(diào)查中會有大量受訪者拒絕支付。根據(jù)其背后動機的不同，零響應(yīng)群體又可進一步區(qū)分為“真實零響應(yīng)”（True Zero Response）和“抗議性響應(yīng)”（Protest Response）兩類。真實零響應(yīng)表示環(huán)境變化的邊際效用為零，受訪者因此表現(xiàn)出無差異偏好；而抗議性響應(yīng)則意味著，雖然環(huán)境變化的邊際效用大于零，但受訪者會因為對支付工具不滿意或?qū)κ袌龅恼鎸嵭员硎緫岩傻仍蚨x擇拒絕支付。抗議率表示受訪者對調(diào)查問卷的理解程度，是衡量問卷內(nèi)容有效性的一個檢驗指標（杜麗永等，2013）。

在零響應(yīng)方面有兩個問題值得研究：第一是如何識別零響應(yīng)者是抗議行為還是真實行為；第二是如何處理零響應(yīng)樣本。早期的做法是將其直接剔除（如張志強等，2004）或者用較小的正數(shù)（通常為1元）替代（如張明軍等，2007）。直接刪除不僅忽視了抗議性響應(yīng)和真實零響應(yīng)有著完全不同的經(jīng)濟學含義，而且還損失了有效的信息，更可能造成樣本選擇偏差（Sample Selection Bias）。而用較小的正數(shù)作為零響應(yīng)者的真實WTP，由于缺乏理論依據(jù)導致主觀隨意性很強。

本研究采取的應(yīng)對措施如下：避免使用有爭議的支付工具；調(diào)查過程中避免使受訪者產(chǎn)生反感；向受訪者說明我們的身份及調(diào)查目的，并指出他們的回答受法律保護；對拒絕支付的受訪者追問其拒絕支付的原因，通過構(gòu)建評價指標區(qū)分零響應(yīng)受訪者的所屬類型。綜合對比直接刪除法、替代法以及更為正式的Spike模型和樣本選擇模型的估計結(jié)果的有效性和可靠性；零響應(yīng)樣本過多時同時報告中位數(shù)WTP估值結(jié)果。

3.2.2.8 信息偏差

CVM問卷所提供信息的數(shù)量和質(zhì)量至關(guān)重要，CVM的有效性和可靠性在很大程度上受到信息提供數(shù)量、質(zhì)量和順序的影響。當受訪者對所評估的對象較為陌生時（如非使用價值），若信息提供不充分或者不恰當，受訪者就無法形成明確的消費偏好。當然，如果問卷所提供的信息與受訪者固有的知識結(jié)構(gòu)相悖，那么也會造成另一種偏差。

一般來說，受訪者需要掌握的信息包括評估對象的特征、預(yù)算約束、替代品和互補品的信息、其他人的支付信息等。在這些信息中，最重要的是預(yù)算約束信息和替代品信息（Arrow et al., 1993；董雪旺等，2011）。當然，問卷所提供的信息并非越多越好，除了受問卷容量的限制以外，信息量過大或過于復(fù)雜還可能導致受訪者產(chǎn)生厭倦心理。此外，還要考慮問卷所提供的信息與受訪者既有信息之間的偏差。例如Elcin通過調(diào)查發(fā)現(xiàn)，如果問卷提供的信息過多或過于復(fù)雜，那么受訪者會無視問卷所提供的信息（Elcin,2011）。

本研究采取的應(yīng)對措施如下：進行多輪預(yù)調(diào)查，反饋修正問卷；保證項目信息的透明度；提供替代品和互補品信息；適當提供社會媒體的觀點進行引導。

3.2.2.9 起始點偏差

起始點偏差主要發(fā)生在逐步競價法和支付卡競價法中。最近的一些研究顯示，封閉式雙邊界下的起始點偏差問題也應(yīng)當引起足夠的重視（Herriges and Shogren,1996; Veronesi et al., 2011）。在上述競價方法下，設(shè)計問卷時應(yīng)首先擬定一個初始投標點。但是，受訪者如果對評估對象不熟悉，就會選擇初始投標點作為參考，從而影響受訪者最終出價的大小。通俗地說，受訪者在前后兩次詢價過程中可能存在學習效應(yīng)。理性的受訪者完全有可能根據(jù)第一次的響應(yīng)和第二次的投標值來修正第二次的回答。一般而言，較高（低）的競價起始點相應(yīng)地會得到較高（低）的平均支付意愿估值。起始點偏誤主要源自錨定效應(yīng)（Anchoring Effect）和認同偏差（Yea-saying bias）（Michell and Carson,1989）。例如，Herriges和Shogren（1996）在一項研究中發(fā)現(xiàn)，DBDC的錨定系數(shù)為0.36，從而造成了WTP的顯著高估。遺憾的是，國內(nèi)研究中迄今尚未有涉及這方面的研究。部分原因在于分析起始點偏差需要運用復(fù)雜的統(tǒng)計知識。

本研究采取的應(yīng)對措施如下：設(shè)計多組起始點，在受訪者之間隨機分配。當然，這只是權(quán)宜之計，后續(xù)研究中應(yīng)采用計量模型進行更為嚴謹?shù)姆治觥?/p>

3.2.2.10 模型設(shè)定偏差

在CVM調(diào)查中，不同的詢價方法所采集到的數(shù)據(jù)的格式及特征并不相同。例如，開放式詢價得到是連續(xù)數(shù)據(jù)，而封閉兩分式詢價采集到的是離散數(shù)據(jù)。此外，無論采用何種調(diào)查方法都難免存在零響應(yīng)問卷，從而會影響分布函數(shù)的選取。因此，對零響應(yīng)數(shù)據(jù)的處理實質(zhì)上也體現(xiàn)了模型設(shè)定問題。

以SBDC詢價方法為例，現(xiàn)有研究大都采用BOX-COX線性效用函數(shù)模型或者非線性效用函數(shù)模型。前者主要包括Probit和Logit概率模型，而后者主要包括對數(shù)Probit模型、對數(shù)Logit模型以及Weibull模型等。但是，這些模型的共同缺點是其福利估算（WTP）表達式的理論取值范圍是負無窮到正無窮，而沒有考慮預(yù)算約束問題（Bohara et al., 2001）。此時，截斷模型（Truncated Model）或受限模型（Censored Model）是更為合理的選擇。

此外，在福利計算上也有中位數(shù)和平均數(shù)兩種不同指標。從統(tǒng)計學角度來看，均值估計受WTP分布函數(shù)的峰度和偏度的影響很大。傳統(tǒng)估計設(shè)定隱含的假設(shè)是不存在零或負支付意愿，這意味著實際WTP的分布函數(shù)存在“右偏”現(xiàn)象，導致WTP被高估。此外，均值估計還會受到右側(cè)“厚尾”（Fat Tail）問題的困擾。與此不同，中位數(shù)估計受異常值的影響較小。從經(jīng)濟學角度看，均值估計與Kaldor-Hicks的潛在補償標準（Potential Compensation Principle）相符，而中位數(shù)的理論依據(jù)則是多數(shù)投票原理（Principle of Majority Voting）。案例研究顯示，WTP的中位數(shù)和平均數(shù)相差很大（如杜麗永等，2013）。

最后，無論是Probit模型還是Logit模型及其變形，均隱含地假設(shè)隨機擾動項服從某種已知的函數(shù)分布形式。從估計方法來看，這些都被稱為參數(shù)估計。一個自然的問題是，如果不清楚隨機擾動的分布函數(shù)形式，那么又該如何處理？此時，半?yún)?shù)或無參數(shù)估計方法應(yīng)該成為一種備選方案。有關(guān)CMV的模型設(shè)定問題將在第四章集中討論。

本研究采取的應(yīng)對措施如下：采用線性參數(shù)模型、對數(shù)參數(shù)模型以及非參數(shù)模型進行估計，并從經(jīng)濟學意義、統(tǒng)計學意義以及政策導向意義三個視角進行綜合對比。

3.2.2.11 匯總偏差

匯總偏差包括兩方面的內(nèi)容：一是重復(fù)計算問題；二是市場范圍問題。長江生態(tài)系統(tǒng)恢復(fù)所帶來的生態(tài)效益內(nèi)容很寬泛（如生物多樣性、游憩價值、農(nóng)業(yè)灌溉等），而在問卷調(diào)查時是分開進行的。因此，必須考慮不同價值是否具有可疊加性、是否存在重復(fù)計算問題。

此外，在估計總價值時必須對利益相關(guān)者進行識別。例如，白鰭豚從生物多樣性角度看是純公共品，其潛在受益者可能并不限于南京地區(qū)。整個江蘇省乃至全國都可以成為其潛在的“市場”。但長江生態(tài)系統(tǒng)恢復(fù)對城市用水安全的改善卻具有局部性，其市場范圍局限在南京地區(qū)，在某種程度上也包含下游地區(qū)。從公共經(jīng)濟學的角度看，評估長江生態(tài)系統(tǒng)恢復(fù)的價值，理論上應(yīng)該按照生態(tài)產(chǎn)品或服務(wù)的不同類別確定不同的市場范圍，但實踐上是否可行還需要進一步研究。無論如何，合理地界定目標總體是正確進行成本收益分析的關(guān)鍵。需要特別強調(diào)的是，匯總偏差和CVM本身無關(guān)，而是一個如何定義公共品價值的問題。

本研究采取的應(yīng)對措施如下：選取與日常生活聯(lián)系較為密切的幾類非市場價值進行估算，同時根據(jù)屬地特征識別利益相關(guān)者。

3.2.2.12 其他偏差

1．樣本選擇偏差

問卷本身和抽樣方法如出現(xiàn)問題，則會造成樣本選擇偏差。由于我國的特殊文化背景，入戶調(diào)查拒訪率較高。一個更為現(xiàn)實的辦法是在商業(yè)區(qū)或公園等公共場所進行偶遇調(diào)查。

本研究采取的應(yīng)對措施如下：采用封閉式詢價方法，共發(fā)放1700份問卷，回收1592份有效問卷，同時將樣本特征和總體特征進行多方面的比較，以保證樣本的代表性。

2．問題順序偏差

問題順序偏差指當問卷中需評估多種價值（如長江的游憩價值、生物多樣性價值、農(nóng)業(yè)灌溉價值等）時，若改變某一問題的順序，則受訪者的支付意愿會因評估對象的順序發(fā)生變化而有所不同，從而產(chǎn)生不同的評估結(jié)果。

本研究未研究此項內(nèi)容。

3．認同偏差

認同偏差指受訪者可能出于道德滿足等原因，會盲目地對所調(diào)查的內(nèi)容表示認同，而沒有考慮到自己的收入現(xiàn)狀和預(yù)算約束。

本研究采取的應(yīng)對措施如下：提醒受訪者問卷選項沒有對錯之分，減輕其心理壓力。

4．調(diào)查人員偏差

調(diào)查人員偏差（Interviewer Bias）源自調(diào)查人員。調(diào)查員的訪問技巧、對問卷內(nèi)容的熟悉程度以及工作態(tài)度等，對受訪者都可能具有暗示或誤導作用，從而影響受訪者正常決策。

本研究采取的應(yīng)對措施如下：調(diào)查員以南京戶籍高年級本科生為主，并對調(diào)查員進行專業(yè)培訓，提升其對問卷內(nèi)容和調(diào)查流程的熟悉程度。

3.2.2.13 簡要評述

需要指出的是，各種偏差并不是孤立的，有時候可能交叉，相互影響、相互作用。例如，假想偏差和策略性偏差之間具有互相抵消的關(guān)系。若受訪者認為假想市場不真實，則不會存在策略性偏差；反之若有策略性行為，則很大程度上是因為“市場”的真實性較高。起始點偏差、支付工具偏差、零響應(yīng)偏差、信息偏差等都可以通過優(yōu)化問卷設(shè)計和調(diào)查過程避免或降低。但有一些偏差則和受訪者的特質(zhì)具有很大關(guān)系，例如策略性偏差。此時，最好的辦法是通過問題設(shè)計將策略性行為者甄別出來。

最后需要強調(diào)的是，假想偏差始終是CVM最根本和最關(guān)鍵的軟肋，是導致CVM被質(zhì)疑的最重要的原因。假想偏差對于任何CVM研究都是不容忽視的關(guān)鍵問題。總的來說，各類偏差不至于對CVM的正確性造成本質(zhì)上的影響。因為CVM是彈性很大的方法，許多偏差可以通過問卷設(shè)計與統(tǒng)計方法的應(yīng)用進行評估，并且能將偏差控制在可允許的范圍。此外，CVM偏差的存在并沒有定論，并非所有的CVM研究都會有偏差發(fā)生。就多數(shù)政策分析而言，決策者可能更為關(guān)注的是估計值的范圍而非精確值，此時CVM足以勝任。

3.2.3 降低CVM假想偏差的途徑

檢驗CVM是否存在假想偏差主要有三種方法：一是將CVM評估結(jié)果和實際市場交易的價格進行對比；二是通過構(gòu)建模擬市場，將CVM組與實際支付組的WTP進行對比；三是將假想市場行為和實際投票行為進行對比。其中又以前兩種應(yīng)用得最為廣泛。國外學術(shù)界以實驗經(jīng)濟學為基礎(chǔ)的第二種方法，近年來逐漸成為檢驗CVM假想偏差的首選工具。然而，社會科學領(lǐng)域內(nèi)的實驗畢竟不同于自然科學，很難保證控制組和參照組是在“保持其他條件不變”的前提下進行對比的。CVM的捍衛(wèi)者完全有理由質(zhì)疑，實驗所發(fā)現(xiàn)的CVM假想偏差究竟是由CVM方法論特征所致，還是應(yīng)當歸咎于實驗設(shè)計本身的缺陷。

討論假想偏差時以下問題可能更值得我們?nèi)ニ伎迹杭傧肫钤诘湫偷腃VM研究中是否存在？如果存在，偏差程度又有多大？影響假想偏差的因素又有哪些？WTP或WTA對假想偏差有何影響？不同的詢價方法是否會影響假想偏差？對同一個體進行不同實驗與對不同個體進行不同實驗所得到的結(jié)論有無差異？實驗室實驗和田野實驗的結(jié)論是否相同？公共產(chǎn)品和私人產(chǎn)品的評估結(jié)果又有何不同？更為重要的是，又有哪些方法能夠緩解假想偏差？在多大程度上有效？

降低CVM假想偏差的常用方法包括事后處理和事前處理兩類。以封閉式問卷為例，傳統(tǒng)的CVM估值問題只提供“愿意”“不愿意”兩個選項，即“要么接受要么拒絕”（Take It or Leave It）。但這樣忽視了部分受訪者的響應(yīng)實際上介于“愿意”和“不愿意”之間，即存在不確定性。假想偏差的事后處理就是采用不確定性量表對受訪者的響應(yīng)進行校正。或者直接將不確定性內(nèi)嵌于選項之中，或者是采用追問的方式詢問其決策的確定程度。

事前處理主要是采用廉價磋商（Cheap Talk）等機制促使受訪者和調(diào)查員之間達成某種口頭協(xié)議。“廉價磋商”一詞源于博弈論，是指參與人在博弈開始前進行沒有媒體中介的、非承諾約束的、無成本或低成本的簡單對話，然后按照預(yù)先商定的規(guī)則行事。 2005年諾貝爾經(jīng)濟學家獲得者之一Robert Aumann的一個重要貢獻就是與廉價磋商有關(guān)的“交互認知論”。盡管無法保證磋商一定能達成某種協(xié)議，或者即便達成協(xié)議也不一定會遵守，但事前磋商被證明是誘導博弈結(jié)果出現(xiàn)納什均衡的有效手段（Aumann,1974）。

近年來，也有學者建議采用“時間措施”來降低假想偏差（如Whitehead et al., 1992）。其基本思想是，在進行詢價時并不要求受訪者立即給出答復(fù)，而是留給受訪者一定的思考時間（Give Time to Think），時間間隔通常為隔夜（Overnight）。時間措施的合理性在于：一是可以消除當面調(diào)查時受訪者存在的“取悅調(diào)查員”的心理動機；二是允許受訪者與家庭其他成員進行商討，其所做的選擇更為可靠；三是受訪者能夠更為理性地考慮其家庭預(yù)算約束。

也有學者建議采用“留置問卷調(diào)查方式”（Drop-off Survey）來降低假想偏差（如Labao et al., 2008）。留置調(diào)查是指調(diào)查員至受訪者家中訪問，將調(diào)查事項解釋清楚后留下問卷，日后再予以回收的方法。留置問卷具有和時間措施非常相似的優(yōu)點，二者存在的共同缺點如下：一是很難保證是否是受訪者本人填寫問卷，可能會造成選擇結(jié)果與人口學特征不甚相符；二是需要委托調(diào)查及回收問卷共兩次訪問，調(diào)查成本較高；三是調(diào)查地域范圍有限，也不利于對調(diào)查人員進行管理監(jiān)督。

在我國特殊的文化背景下，公眾的社會參與度不高，入戶調(diào)查的執(zhí)行難度很高，調(diào)查對象或是心存疑慮，或是存在抵觸情緒，或是消極作答。這就決定了時間措施和留置問卷方法在我國當前執(zhí)行難度較大。

官术网_书友最值得收藏!

流域生態(tài)系統(tǒng)恢復(fù)價值評估：CVM有效性與可靠性改進視角

3.2 CVM的有效性與可靠性

3.2.1 CVM的有效性與可靠性研究

3.2.2 CVM有效性和可靠性的影響因素

3.2.3 降低CVM假想偏差的途徑