- 基本公共服務均等化:知識圖譜與研究熱點述評(國家治理研究書系)
- 姜曉萍 田昭等
- 14395字
- 2019-12-13 20:39:57
第二章 基本公共服務均等化研究方法現狀與述評
謝星全(91)
根據研究主題,筆者在中國學術期刊網絡出版總庫圍繞篇名“基本公共服務”檢索出中文社會科學引文索引( CSSCI)來源(含擴展版) 、核心期刊收錄學術論文7 5 8篇,擇取主題為“均等化”議題論文5 0 5篇,篩選出實證研究取向的論文后,重點對公共服務均等化方法論進行了述評,并對國內學界采用的主要定量研究方法進行述評,如普通最小二乘法( OLS)估計、面板模型、綜合評價、指數法、因子聚類分析、方差分析等,并對其數理邏輯進行了簡單介紹,以期“拋磚引玉” ,推動基本公共服務研究的規范化和科學化。
一、我國基本公共服務均等化研究方法總體簡介
1 .重視工具理性,忽視價值導向
傳統公共經濟學派追求工具理性,從財力轉移機制、政府行為偏好、經濟產業結構、地區資源稟賦等角度定量研究我國基本公共服務配置效率、供給范圍及均等化水平,忽視基本公共服務也是保障人權、增加社會福利、促進公平正義等政治哲學議題。基本公共服務不僅要依賴“誰來供給”“為誰供給” “供給什么”等工具理性,解決供給主體、范圍和供給機制等規模效率問題,更應理性思考“為誰供給”的問題,重視基本公共服務的公平、普惠、可及和需求性等價值問題,才能改革傳統單向投入型公共服務供給模式,構建“雙向互動—需求側調節”的新公共服務供給體制。這是提升基本公共服務質量的重要途徑。
2 .客觀評價多,主觀評價少
基本公共服務是面向公眾提供的產品和服務,公眾應是參與基本公共服務生產、分配、消費及評價環節的最重要主體。調查公眾需求表達和滿意度水平的主觀評價是實現基本公共服務“共創共享”的民主途徑。分析國內學界評價公共服務的數據來源,可以發現:它們多為年鑒、政府公報、公開文件、政策文本等客觀資料,采集公眾主觀數據的研究較少。雖然有專家賦權的綜合評價可在一定程度上減少評價偏誤,但是專家意見不等于公眾意見,難以對不同民族、階層、職業群體、年齡、城鄉居民等不同主體的利益進行客觀評判和利益協調。
3 .數據來源差異大,質量參差不齊
基本公共服務數據按來源途徑可分為官方數據和調查數據。前者包括各級政府統計年鑒、公報、政策文件及外國政府或國際組織發布的信息資料(如聯合國計劃開發署發布的人類發展指數等) 。后者則包括抽樣調查數據、定性數據(訪談資料、文本信息等) 、實驗數據。目前,官方數據的有效性存在較多爭議,特別是許多研究者在研究設計中沒有說明數據缺失情況、處理方法,據此得出的評價結論的信度和效度值得懷疑。即便官方數據可以覆蓋不同年份、不同地區、不同行業等數據,但數據全不等于數據質量高。數據的質量取決于其有效性與可靠性,其中數據信息的變異性是衡量數據有效性的重要指標。目前,官方數據多是均值數據,數據平均后導致數據信息變異性差,目標群體的組間差異和組內差距發生偏倚,基本公共服務均等化水平可能被高估或低估。而隨著抽樣調查、定性研究技術的發展和完善,研究者通過嚴格抽樣程序和科學調查方法,可以極大提高數據質量。
4 .定量研究較多,定性研究少
分析國內評估基本公共服務均等化等議題的文獻數量,可以發現公共服務評價和城鄉公共服務均等化議題的實證研究較多,規范分析較少。特別是實證途徑的定量研究大行其道,定性研究鳳毛麟角。基于數理統計基礎的計量模型常面臨經驗數據與理論描述不一致的情形。現實環境的計量模型難以避免變量“內生性”“聯立性”“遺漏性”“函數形式設定錯誤”等弊端,據此統計的變量系數容易有偏和不一致,因此定量研究公共服務問題的結論存在較多爭議。即便運用專家賦權的多維綜合評價方法,但由于賦予變量權重的主觀性較大、標準不一、權重各異,得出的公共服務政策建議難免陷入“眾說紛紜”的尷尬境地。其實,基本公共服務評估和公共服務均等化首先是提供者與受眾的心理感知與評價,考察行政人員與公眾的公共服務動機、個體心理與環境的互動機制為定性研究中的訪談、田野調查、焦點小組、個案研究等方法和實驗研究提供了新視野,有待學界共同努力,推動公共服務研究的規范化、科學化及范式轉變。
5 .評估技術不科學
研究基本公共服務的城鄉差異只有采取“同中求異”的比較研究才能避免選擇偏差和類比推理的謬誤。例如研究者要論證造成基本公共服務城鄉差異的制度誘因是“城鄉二元戶籍” ,科學的研究設計應該是把同一類基本公共服務置于相同地理環境、經濟社會水平、人文氛圍及相似人口屬性特征的多維框架下考察,如果不把這些因素作為控制變量,研究者就不能準確分析均等化的真實水平及戶籍制度的獨立效應。如果研究基本公共服務均等化問題思路不正確,就如用錯誤的研究途徑分析了正確的研究議題,研究結論的信度與效度就值得商榷。
二、我國基本公共服務均等化研究方法述評
(一)泰爾指數法研究述評
泰爾指數“是一個常用的測度個人或地區間收入差距,抑或不均等程度的分析方法”(92)。在公共服務均等化議題中,是反映總熵指數在不同地區或城鄉之間服務差距權重為1的特例。泰爾指數的一般計算公式為

式中,n是樣本數,可以是評價對象的地區如省份、市、縣等;y i代表基本公共服務均等化水平從低到高第i個省的數值。泰爾指數的取值范圍為0~1,值為0表示完全均等,而取值為1表示完全不均等。“泰爾指數的最大特點是可以衡量組內差距和組間差距對總差距的貢獻”(93),而且泰爾指數比變異系數更敏感地反映均等化過程,可以更好地評價地區間的差距。但是一般泰爾指數不能消除人口規模的影響,使用人口加權系數可以在一定程度上糾正泰爾指數的偏差。
曾國平等學者采用泰爾指數法,基于政府年鑒和公報數據,量化分析了我國省級基本公共服務的地區差異和時間趨勢。(95)龔峰利用中國省級義務教育和醫療衛生服務數據計算泰爾指數,評估公共服務供給均等化的區域差距。田發采用泰爾指數法評估財政體制運行對區域基本公共服務均等化的影響效應。蔡曉珊運用泰爾指數法分析了廣東各地公共服務均等化水平。李林君用泰爾指數測算戶籍人口和常住人口兩種口徑下公共服務不均等程度。范柏乃采用浙江省1 1個地市2 0 0 5—2 0 1 2年統計數據,運用泰爾指數法評估了浙江省基本公共服務均等化水平。
(二)變異系數研究述評
變異系數是采用統計學中標準差和均值比來表示的,其公式為
式中,V為變異系數,X i為地區某屬性值(例如:人均教育經費支出) ,n為地區個數。V反映了各地區某屬性值相對于該指標平均值的整體離散狀況,V越大表明某屬性值的區域間差異越大。
加權變異系數考慮了人口規模的影響,其公式為

式中,P i為第i個地區人口數,P為全市人口數,其他同上式,P i/P為i地區占全市人口數的比重,用以反映該地區人口規模的影響。Vn越大表明某屬性值區域間差異越大。
學者王悅榮運用變異系數分別研究了廣東、四川、重慶、深圳、江蘇、新疆的基本公共服務均等化水平。(97)張序、李連芬、王郁分別研究了民族地區、西部教育、環境保護公共服務均等化水平。
變異系數雖然可以消除指標不同量綱的差異,為不同類別基本公共服務橫向比較創造了優勢,但是它的計算過程卻不能敏感地反映不同組間公共服務均等化水平。
(三)威廉森系數法研究述評
威廉森系數是由美國學者威廉森提出的,其計算公式為

式中,W為威廉森系數,y與P分別為區域的某屬性值和人口數,y i及P i分別為該區域內第i個地區的該屬性值及人口數。W值愈大,說明區域內該屬性值區域差異愈大。該指數雖然增加了地區屬性和人口規模的權數,指數有效性較標準化數據高。但是國內單獨采用此研究方法的較少,只是零星出現在綜合評價的文獻中。
(四)標準數據法研究述評
指標不僅存在指標間量綱差異,而且存在正指標和逆(負)指標的差別,可以在面板數據基礎上,對原始數據標準化,消除指標間不同量綱和正負指標差異對因子分析結果產生的影響。標準化方法如下:
zxi=( xi-minxi) / ( maxxi-minxi)
所有逆(負)指標標準化公式為
zxi=( maxxi-xi) / ( maxxi-minxi)
式中,z x i為標準化后的第i個指標數據,正、負指標依次類推,新數據代替原始數據組成新的標準化指標數據。
單獨采用標準化指標評估基本公共服務均等化水平的研究較少,研究者通常把數據標準化消除量綱差異,再作為綜合評價和計量分析的技術手段。如唐天偉用標準化指數對2 0 0 3—2 0 1 2年我國省級基本公共服務財政支出排序與分類,評價了我國省級基本公共服務的時間趨勢和空間差異。
(五)基尼系數法研究述評

式中,G是基尼系數;N為樣本量;-Y為樣本均值;Y 1,Y 2,Y 3,…,Y n為從大到小的樣本值。
李洺運用基尼系數作為公共服務均等化服務標準,分析了我國改革開放后居民絕對收入及生活質量的差異。崔惠玉等通過測算遼寧1 9 8 7—2 0 0 7年的教育基尼系數,分析了遼寧公共教育均等化水平。(99)武力超構建基尼系數,估測各省份的公共服務均等化水平。魏福成綜合了7大類基本公共服務評價指標,對2 0 0 5—2 0 1 2年省際的基本公共服務均等化狀況進行了考察。
運用基尼系數去測度公共服務均等化程度是不盡合理的,原因有二。一是,基尼系數的原始數據一般不是目標對象的所有數據,而是來源于抽樣調查,抽樣方法及樣本量的不同直接影響基尼系數評估公共服務均等化水平的準確性。二是,基尼系數實際上反映了某類基本公共服務總體時點的差異水平,卻不能有效測度不同層次基本公共服務在連續時間軸的發展趨勢。
三、綜合評價研究方法述評
在公共服務均等化領域,綜合評價是常用研究方法,主要用于考察指標值變異的程度。綜合評價是整合定量與定性分析思路的研究方法,既可以縮小客觀數據與主觀情境的差距,也在一定程度上減少了主觀評價的隨意性。綜合評價主要有層次分析法、熵值法及模糊綜合評價法等。
層次分析法受主觀評價影響最大,熵值法受主觀隨意性干擾最小,模糊綜合評價居于其中。下面,筆者對上述研究方法及應用現狀做簡單介紹。
(一)層次分析法研究述評
層次分析法( analy tichierarchyprocess,AHP)主要適用于決策結構復雜、決策準則多、指標確權性較大的綜合評價問題,是典型的復雜問題簡單化的操作方法。層次分析法是主觀賦權法的一種,其主觀因素就表現在對各指標權重的選擇上,實證中往往采用問卷調查的形式來確定每一級指標的權重。基本公共服務是多類別、多層次的政策議題,運用層次分析法對基本公共服務進行分層研究,不僅思路清晰,確權容易,且通過判斷矩陣及一致性檢驗能夠確立指標權重的信度及合理性。
1 .層次分析法簡介
筆者以層次分析法為例,對研究基本公共服務均等化的層次分析方法的一般過程做簡介。
( 1)建立基本公共服務層次結構。研究者首先要確定基本公共服務均等化評價層次及其指標體系。例如研究者可以建立四類三級層次的基本公共服務評價體系,如圖2—1所示。
( 2)建立權重評價矩陣。層次分析權重結構見表2—1。
經過公共服務專家、政府官員、公眾等多主體反復磋商,最后得出評價指標權重系數如表2—2所示。
專家對同一層次指標進行兩兩比較,給出它們相對重要的判斷值,全部指標經過兩兩判定之后,就可以形成一個比較判斷矩陣。這里為不失一般化,筆者采用b m*n矩陣進行示例:

式中,B i為當前層目標評價因素,b i j是B i相對于Bj的重要度,例如以表2—2中基本公共服務A和基本公共服務B為例,bAB表示基本公共服務A相對于基本公共服務B的重要度。
( 3)計算單準則條件下指標的權重系數。運用特征根法( eigenvaluemethod,EM)計算該權重系數,并將其歸一化為同一層次中相應指標對上一層某個指標的權重向量。計算判斷矩陣B每一行元素的幾何平均值( n是矩陣階數) :

做歸一化處理:

式中,Wi為所求指標的權重系數值,最后的權重向量W=( W1,W2,…,Wn)T。
( 4)進行一致性檢驗。為了保證所得權重的合理性及正確性,在計算權重向量后,應對每個判斷矩陣都進行一致性檢驗,無法通過一致性檢驗的矩陣,反饋給打分者,由其對指標分值進行適當修改。求判斷矩陣的最大特征根λmax:

計算一致性評價指標,將CI作為度量判斷矩陣偏離一致性的指標:

計算一致性比率CR,為了得到不同階數的矩陣均適用的一致性檢驗的臨界值,還需引入平均隨機一致性指標RI,n-2階數的判斷矩陣所對應的RI值見表2—3。
通過公式CR=CI /RI,求得隨機一致性比率CR。當“ CR≤0﹒1時,一般認為該判斷矩陣具有滿意的一致性;當CR>0﹒1時,則認為該判斷矩陣不具有一致性,應該調整判斷值,直到通過一致性檢驗為止”(100)。
( 5)計算組合權重。評價指標的組合權重是每層指標系數占總目標的權重系數,例如基本公共服務A~D的各項指標系數占基本公共服務總體系數的權重,其數值是上一層評價指標與下一層評價指標權重系數的乘積。
( 6)對基本公共服務進行分類評價。按照層次分析法得出的各項基本公共服務的權重系數乘以其各層指標的數值,就可得出各項基本公共服務指數,然后建立相應的衡量標準,如“區位熵”等,用以評估各項基本公共服務的時空差異。
2 .公共服務均等化層次研究方法述評
采用層次分析法的學者,如王新民評估了我國省級公共服務均等化水平;劉亮測度了我國體育公共服務的均等化水平;林閩鋼等評價了江蘇公共服務均等化水平;皮燦研究了廣州馬賽克式村落公共服務設施均等化水平。
國內學界運用層次分析法研究基本公共服務均等化議題,指標賦權存在主觀隨意性較強的缺點。基本公共服務不僅是客觀指標的量化,也是典型的主觀概念。一是,其蘊含豐富的政治哲學意蘊,公共價值本身是難以量化的多維概念,不能簡單被統計數據代表;二是,層次分析法的判斷矩陣的指標賦權深受評分者知識、經驗及態度的影響,難以避免權重隨意性大的缺陷。
(二)熵值法研究述評
在信息論中,熵是系統無序程度的度量。熵值法可以盡可能地保留數據原始信息,減少確定權重的主觀性以及多指標變量間信息的重疊。通過計算評價指標信息的離散程度確定各項指標的權重,評價對象的指標值離散程度越高,信息熵越小,說明該指標包含信息越多,其權重也越大;反之該指標的權重越小。當評價對象各項指標離散程度為0時,熵值取最大值,表示該指標不能提供有效信息,應該從評價項目中剔除。
設有m個基本公共服務方案,n項評價指標,形成原始指標數據矩
陣X=( xij)m*n,其中xij≥0,0≤i≤m,0≤j≤n。對于某項指標,不同方案的指標值xij差距越大,則該指標在綜合評價中所起的作用越大,其權重也越大。具體公式如下:

( 1)標準化數據。
為了減少評價對象量綱和數量級的差異,需要對原始指標進行標準化處理。主要有統計標準法和極值標準法,這里主要介紹極值標準法,通常需要對正負指標做不同處理。計算第i個地區的第j個評價指標的比重y i j。
正指標:

負指標:

( 2)計算第j個指標的熵值。

式中,k>0,ln為自然對數,ei≥0。如果x i j對于給定的j全部相等,那
么。若設k=1 / lnm,于是有0≤e i≤1。計算第
j個指標的差異性系數
gi=1 - ei
式中,0≤g i≤1。差異系數表示某項指標的離散程度,反映了該指標信息有效性大小,它取決于該指標的熵值ei與1之間的差值,決定指標權重的大小。例如,對于第i項指標,離散程度越大,熵值就越小,有效信息就越高,權重系數也就越大,綜合評價就越受該指標的影響。
( 3)計算權重。

( 4)計算綜合得分。

式中,Sm是第m項公共服務方案的綜合得分。
由于熵值法可以最大限度減少主觀隨意性,盡可能地反映數據原始信息,通常與其他技術結合使用,已成為綜合評價最多的研究方法。單獨運用熵值法研究公共服務均等化議題較少。沙智慧運用熵值法評價四川城鄉基本公共服務均等化水平;王肖惠量化分析了陜西農村公共服務的空間差異;徐翠枚評估海南省公共服務均等化水平;馮驍研究了我國城市公共服務的空間差異與影響趨勢。
四、基本計量模型研究方法述評
(一)運用面板數據研究基本公共服務均等化述評
如果研究者要探索基本公共服務在不同時點的影響因素、形成機制、作用大小或隨時空變化的動態趨勢,面板數據方法是理想的研究方法。正如我們指出的那樣,基本公共服務是一個隨時間變遷和跨區域的公共產品和服務,它既有隨時間不隨地點而變化的可觀測特質,也有隨地點而不隨時間變化的屬性,還有隨時間又隨地點而變化的動態特性。采用大樣本容量,把不同時點從同一總體中抽取的多個隨機樣本混合起來使用,可以獲得更精密的估計量和更具功效的檢驗統計量。筆者認為,實現對我國城鄉基本公共服務均等化的動態監測,面板方法是有效途徑。
面板數據是研究者在不同時間盡可能地跟蹤同一個人、同一個家庭的公共教育支出、勞動就業小時數、基本衛生醫療設施等信息資料集合。在以后若干時點上,對同樣的人群反復采訪,以便得到同一群人在不同年份的基本公共服務信息資料。我國學界多采用年度省級面板數據,數據均來自官方的年鑒、公報等政策文件,指標的客觀性較強。使用主觀調查的動態面板數據(如中國家庭金融調查、中國家庭動態調查等)研究基本公共議題的較少。
1 .面板數據的一般模型
對于隨機抽取的橫截面觀測值i來說,基本的不可觀測效應模型( UEM)可以寫為
yit=xitβ+ci+μit( t=1,2,…,T)
式中,xit表示一個1*K向量,它能夠包含隨t而不隨i變化的可觀測變量、隨i而不隨t變化的可觀測變量,還有隨i又隨t變化的可觀測變量。對于ci來說,在應用中也稱為“不可觀測效應”“特征變量”及“不可觀測異質性” 。在公共服務議題研究中,它可表示為個體感知水平、家庭隱性收入、公共服務質量等橫截面數據,μit表示特質誤差或特質擾動項,它表示不可觀測的變量,這些變量既隨時間t而變化也隨i變化,例如它可以代表不同個體的公共服務滿意度、公共財政支出、政府支出偏好去影響因變量yit。在面板數據模型傳統處理方法中,當把ci看成一個隨機變量時,即當研究者從理論上認為或邏輯判斷ci與可觀測解釋變量xit和不可觀測特質誤差項μit都不相關時,該模型被稱為“隨機效應”模型。相反,當ci看成一個隨機變量時,即當研究者從理論上認為或邏輯判斷ci與可觀測解釋變量xit存在任意相關性時,此時ci稱為“個體固定效應” 。針對ci的不同性質,研究者通常會分別采取隨機效應估計和固定效應估計β系數。
2 .面板模型的假設與估計
在高級計量經濟學中,研究者一般不假設x i t是非隨機的,而是限制y i t的期望值如何依賴于其他時期的解釋變量,即對于s≠t,一旦控制xit 和ci時,xis對yit沒有偏效應,這樣的假設與沒有以不可觀測效應為條件的嚴格外生性假設相比,卻更符合現實情況。
對于面板不可觀測效應模型,傳統上有兩類估計方法:
( 1)當對于固定時間T而言,橫截面樣本N充分大時,采用混合O L S估計模型參數是漸進有效的;
( 2)當μit在控制xi和ci條件下的期望為0,且它的方差具有隨時間t變
化的常數值時,當N→∞,的估計系數是漸進一致的;當且μi t是序列相關時,利用穩健方差矩陣可獲得沃爾德統計量去構造有效的統計推斷,此時可采用一般F G L S分析,特別是對于非常大的N來說,該方法估計是不錯的選擇。更多情況是,研究者利用面板數據考慮ci與x it是任意相關時,固定效應估計方法是不錯的選擇。當μi t在控制x i和c i條件下的期望為0時,此時固定效應要滿足兩個假設條件:當xit的每一個元素對于某些橫截面單位來說是不隨時間而變化時,
是以X為條件的無偏估計量;當μit的方差是不隨時間t變化的常數時且不存在序列相關時,N→∞,
估計量是漸進有效的,此時普通最小二乘法和差分法是合適的估計方法。
3 .國內面板數據研究述評
王磊通過建構柯布—道格拉斯生產函數模型,利用1 9 9 7—2 0 0 4年青海省的時間序列數據和我國1 3個省市2 0 0 3年的面板數據建立計量模型,實證了我國各項財政支付政策對公共服務均等化的影響。(104)安體富采用中國3 1個省份2 0 0 2—2 0 0 6年共5年的面板數據,實證分析了財政能力、轉移支付與公共服務水平的內在聯系。賈俊雪運用空間面板數據模型考察了改革開放以來我國政府間財政收支責任安排對地方公共服務發展和均等化的影響。劉成奎基于2 0 0 4—2 0 1 1年我國2 6個省份的面板數據,實證分析了財政分權、地方政府城市偏好與基本公共服務均等化的關系。趙楠通過1 9 9 8—2 0 0 8年的面板數據實證檢驗中央財政轉移支付在民族地區公共服務均等化中的效應。和立道基于2 0 0 0—2 0 0 8年的面板數據的估計,實證分析財政支出、居民收入水平、城鎮化與城鄉基本公共服務供給的內在聯系。胡洪曙采用空間面板模型,分析2 0 0 5—2 0 1 2年各省政府基本公共服務財政投入和產出水平的空間相關關系,研究了轉移支付對公共服務供給的空間作用機制。甘家武采用面板似不相關回歸估計方程(SUR)進行估計,考察了2 0 0 0—2 0 1 1年云、貴、川和黔四省區之間的基本公共服務均等化、商品市場分割的變化趨勢。劉成奎采用2 0 0 4—2 0 1 0年中國2 8個省份面板數據的聯立方程組,定量分析了政府城市偏好、網絡信息與城鄉基本公共服務均等化的一般聯系。趙建國采用我國2 0 0 4—2 0 1 3年年鑒和政府公報數據,構建面板模型,實證研究中央財政轉移支付制度對東、中、西部地區基本公共服務供給均等化的影響。
目前,學界應用面板研究基本公共服務均等化的棘手問題之一是不能假定不同時點的觀測數據是獨立分布的,如果假設不滿足,估計參數會產生嚴重偏誤。需要研究者敏銳識別模型錯誤并采取補救技術,修正相關模型后,謹慎地得出結論。
雖然國內學者常用差分法消除那些不隨時間變化的無法觀測的變量,例如基本公共服務屬性,普惠性、公平性等變量,但是現實情況是面板模型的回歸元如地方政府財政收入與上一期的公共財政支出有顯著相關性,此時固定效應估計量的效度將會顯著下降。
另一個常被國內學界忽略的問題是,面板模型的數據存在測量誤差時,差分估計會失效。例如我國統計年鑒數據的真實性和有效性一直備受爭議,如果數據存在測量偏差,差分面板模型將會導致比混合OLS估計更糟糕的結果,研究結論幾乎無效度可言,需要研究者小心地求證,謹慎地得出結論。
(二)OLS估計法研究基本公共服務均等化述評
使用回歸分析是探索公共服務均等化解釋性問題的基本途徑,可以對公共服務均等化的影響因素、形成機制、演變趨勢及功能價值做出評價、解釋、預測,并據此提出相關對策建議。筆者首先簡單回顧OLS估計一般方法,然后再對回歸模型的前提假設及應用問題進行闡釋。
1 .OLS多元回歸分析的一般模型簡介
多元回歸分析允許我們分析多個可觀測因素(解釋變量或自變量)x影響被解釋變量(因變量)y。一般的多元回歸模型總體可以寫成
y=β0+β1 x 1+β2 x 2+β3 x 3+…+βk x k+μ
β0為方程截距,β1,β2,…,βk分別是與x1,x 2,…,x k相聯系的參數,我們把這類不同于截距的參數βk稱為斜率參數,它表示在控制其他變量因素條件下,x k每變化一個單位,y平均變化βk個單位。但是對于OLS估計量要達到無偏性和有效性,卻需要滿足以下幾個前提條件:
( 1)OLS估計的總體模型需要是β0,β1,…,βk的線性函數,但是y和自變量xk都可以是我們所關注變量的任意函數,因為這樣才能保證參數對y的合理有效的解釋。
( 2)變量是包含n次觀測的隨機樣本,{ ( xi1,xi2,…,xik,yi) ,i=1,2,…,n}它來自假設1的總體模型。
( 3)在樣本中(因而在總體中) ,沒有一個自變量是常數,自變量之間也不存在嚴格的共線關系,即該假設允許自變量之間存在相關關系,但不能高度相關。
( 4)給定自變量的任何值,誤差μ的期望值為0,此假設表明總體模型沒有遺漏與自變量相關的重要因素,且模型的函數形式設定正確(如沒有不正確的設定自變量的高次項和交互項等) 。
統計研究表明,在假設( 1)~( 4)下,回歸估計量是總體參數βj的無偏估計量,即
。
( 5)總體模型中給定任意解釋變量,誤差μ都具有相同的方差,它表示在誤差方差是常數時,OLS估計參數是總體真實參數的一致估計量。
2 .國內OLS估計基本公共服務均等化研究方法述評
皮燦以廣州市各區(市)為評價單元,采用皮爾遜相關分析法及通徑分析法,分析了廣州公共設施的空間差異及基本公共服務的供需狀況。王敬堯采用雙變量probit模型進行回歸分析發現,公共服務產出和公民感受呈現顯著的非一致性。宋潔用R型聚類和復相關系數篩選指標,實證研究某省1 9 9 1—2 0 0 9年公共服務均等化水平。胡德仁采用多元線性回歸方法,利用2 0 0 4—2 0 0 6年中國各地財政支出數據,分析中國現行財政轉移支付政策的主要影響因素和價值取向。楊亦然采用2 0 0 0—2 0 1 0年統計數據,利用O L S回歸估計方法,研究了重慶市各區縣財政支出對基本公共服務水平的影響程度。侯建明用二元logit模型,分析了長春市、吉林市、延邊朝鮮自治州三地流動人口公共服務均等化水平。(106)。
筆者認為,國內OLS估計研究公共服務均等化議題可能存在的缺陷主要有以下幾個方面:
( 1)研究者缺少總體模型是線性參數的論據。
OLS回歸估計方法的第一個前提是研究者必須理論論證或給出的總體模型是線性的統計證據,否則回歸估計模型參數將是有偏的。國內許多研究者在使用OLS估計時,沒有給出殘差散點圖和回歸擬合圖,也缺少總體模型是參數的線性理論說明。如此,公共服務均等化統計結論的效度是有待商榷的。
( 2)變量多重共線問題。
國內部分學者用OLS估計法研究公共服務均等化議題時,許多解釋變量在理論上是顯著相關的,如地方政府財政自給能力與中央轉移支付在統計上也可能高度相關,如果是非自動識別多重共線軟件操作,會導致模型估計參數的嚴重偏誤,如果不尋找有效的代理變量或工具變量,則又可能會造成模型遺漏變量問題,導致估計參數有偏。
( 3)遺漏變量問題。
在OLS估計基本公共服務均等化模型中,由于基本公共服務理論要素的殘缺、某些理論概念難以量化及數據的不可得性,模型無法避免應該納入模型卻沒有納入模型的變量遺漏問題,會導致模型參數估計的不一致。例如研究者在模型中想研究地方政府財政收入與公共服務支出的關系,按照一般財政學理論,模型顯然遺漏了“經濟建設支出”這一解釋變量,就會造成模型的內生性問題,造成模型估計參數不一致。
( 4)聯立性問題。
在定量研究公共服務均等化模型中,部分變量會互為因果關系。例如地方政府公共服務支出不僅顯著影響公共服務均等化水平,公共服務均等化水平也會影響地方政府公共服務支出數額。研究者如果僅考慮公共服務財力投入的單向影響,則有可能造成模型參數估計不一致,統計結論的可靠性較低。
( 5)異方差檢驗問題。
許多研究者在用OLS估計公共服務均等化模型時,并沒有呈現統計模型是否是異方差的穩健檢驗統計量,如果在異方差條件下,估計參數的方差越大,表明估計量越不精確,也就暗示所給出的置信區間和假設檢驗越不準確,統計結論的信度也就越低。
(三)因子分析法研究基本公共服務均等化述評
因子分析的基本思想是根據評價對象相關性大小把原始變量分組,使得同組內的變量之間相關性較高,而不同組的變量間的相關性則較低。每組變量代表一個基本結構,并用一個不可觀測的綜合變量(因子)來表示,這個基本結構就稱為公因子。對于研究某一具體問題,原始變量可以分解成兩部分之和的形式,一部分是少數幾個不可測的所謂公共因子的線性函數,另一部分是與公共因子無關的特殊因子。設有k個觀測變量,分別為x 1,x2,…,xk,其中x i是標準化變量。因子模型的一般表達式可以表示為
xi=ai1 F1+ai2 F2+…+aimFm+μi( i=1,2,…, k)
在該模型中:
( 1)F1,F2,…,Fm叫公因子,它們是各個觀測變量所共有的因子,解釋了變量之間的相關程度。
( 2)μi為特殊因子,它是每個觀測變量所特有的因子,相當于多元回歸的殘差項,表示該變量不能被公因子所解釋的部分。
( 3)aim稱為因子載荷,它是第i個變量在第m個公因子上的負載,即它們之間的相關系數,它的絕對值數值越大表示變量x i與公因子Fm關系越密切。
( 4)變量xi和xj之間的負載可以理解為通徑系數,如果從觀測數據計算出的相關系數和從模型推導出的變量間的相關系數差別很小,那么我可以說模型很好地擬合了數據,因子解是最優解。
( 5)公因子方差又叫共同度,指觀測變量方差由公因子決定的比例。如變量x i的公因子方差記為hi2。變量的方差由兩部分組成,一部分由公因子決定,一部分由特殊因子決定。公因子方差表示了變量方差中能被公因子所解釋的部分,公因子方差越大,變量能被因子說明的程度越高,公因子代替觀測變量后,保留了每個變量的大部分信息。

( 6)因子貢獻。記為Vp,它等于和該因子有關的因子負載的平方和。現實中,用每個因子所解釋的方差占所有變量的總方差的比例表示,k個變量的總方差記為Vk,則Vp/ Vk表示第p個因子解釋所有變量總方差的比例。
按照經濟計量學關于因子分析的一般描述,因子分析主要包括以下四個步驟:
( 1)計算所有變量的相關矩陣。相關矩陣用于判斷應用因子分析方法是否合適,一是可以看反映象相關矩陣元素數值大小,二是看巴特利特球體檢驗系數大小,如果巴特利特球體檢驗KMO值大于0﹒7,意味著不適合做因子分析的原假設被拒絕,則說明因子分析是合適的。
( 2)提取公因子。這一步研究者可以根據研究目標的不同,選取特征根法或碎石法確定因子數目,但也可以根據理論假設主觀確定有意義的因子數目,這樣就可以求出因子解。
( 3)進行因子旋轉。如果因子分析的目標只是把很多變量濃縮為少數幾個因子,因子的確切含義是什么并不重要,應該選用正交旋轉;如果研究者是想得到幾個理論上有意義的因子,應該選用斜交因子;如果兩個因子確定高度相關,研究者一般會選取更少的因子重新進行分析。
( 4)計算因子值。因子值是各個因子在每個樣本案例上的得分值,一般可采用主成分分析法或公因子法求解因子值。得出因子值后,研究者根據研究目標,把因子作為變量來使用,進行如回歸、分類或綜合評價等其他統計分析。
國內采用因子分析法估算基本公共服務均等化的學者,如姜鑫、成小平對我國省際公共服務均等化水平進行了評估;方元子考察了影響地區公共服務成本差異的環境因素;吳強計算了各省級地區基本公共服務成本差異系數,動態測算各地區所需的轉移支付數額;睢黨臣用因子聚類技術,評估了陜西農村基本公共服務的空間差異和發展趨勢;崔敏、牛芳兵、黃小舟通過實證分析了河南鎮平縣、山東省、武漢市公共服務的區域分布特點。
由于研究者多使用年鑒、公報等客觀數據,提取公因子過程主觀性較大。根據特征根法提取的公因子可能會丟失有理論價值的指標。相反如果采用探索性因子分析,公因子涵蓋的指標可能包括沒有理論意義或錯誤歸類的指標。研究者運用因子分析法,應該在統計指標和專業理論之間做出合理取舍,盡可能地發揮因子分析的優點,減少分析盲目性。
(四)運用方差分析法研究基本公共服務均等化述評
在公共服務均等化議題中,研究者如果要研究基本公共服務均等化水平,可以通過定量分析基本公共服務在城鎮地區和農村地區之間是否存在顯著差異,也就是比較多個研究總體均值問題,方差分析就是有效的方法。在分析隨機變量的可控因素時,如果我們只考察基本公共服務滿意度、財政支出等是否在不同地區(如東部、中部、西部)顯著不同時,我們稱之為單因素分析。如果研究者要同時比較公共服務滿意度、財政支出在不同地區、戶籍、階層、職業等群體分布中是否存在顯著差異,此時可以采用多因素分析。進行方差分析的基本思路是首先通過實驗或調查,取得不同變量(一般是類別變量)觀測水平條件下被解釋變量的樣本,然后利用樣本構造統計量,檢驗被解釋變量總體均值在不同因素(類別變量)的總體均值是否相等,如果均值相等的假設被檢驗,則說明因素及水平對被解釋變量的影響不顯著,反之則顯著。從方差分析目的看,要檢驗被解釋變量如基本公共服務的不同滿意度水平在不同因素之間(地區、戶籍)是否存在顯著差異,而實現這個目的的手段是進行方差比較。我們知道被解釋變量的觀察值差異一方面可能是由因素(不妨稱之為自變量)水平本身造成的,例如公共服務不同滿意度可能是不同戶籍居民評價存在顯著差異,我們稱之為系統性差異;另一方面由于抽選樣本的隨機性而產生的差異,例如農村居民對基本公共服務滿意度也顯著不同。這兩個方面產生的差異可以用兩個方差來分析,一個是水平之間的方差(組間差異) ,另一個是水平內部的方差(組內差異) ,前者既包括系統性差異,也包括隨機性差異,而后者僅包括隨機性差異。如果因素的不同水平不影響被解釋變量的不同觀察水平,那么在水平之間的方差就僅有隨機性差異,而沒有系統性差異,則此時它與水平內部的方差就應該近似,兩個不同水平的方差比值接近于1。反之,不同的水平對結果產生影響,在水平之間的方差中就不僅包括隨機性差異,也包括系統性差異,這時,水平之間的方差就會大于水平之內的方差,兩個方差的比值就遠高于1,當這個比值達到統計臨界值,我們就可以做出判斷,即因素的不同水平之間存在顯著差異。
水平間方差和水平內方差之比通常服從F分布。本文基于現實廣泛應用的多因素方差進行解釋,以無交互作用的雙因素方差分析為例。
假設所有的Xij都互相獨立且服從相同方差的正態分布,即有Xij~N(μij,σ2) 。因此,如果兩個因素對實驗的結果影響都不顯著,那么顯然所有的觀察值有X i j都來自同一分布總體,有Xij~N(μij,σ2) 。記總體均值的總平均值為

a i=μi-μ,稱a i為水平Ai的效應;b i=μi-μ,稱b i為水平Bi的效應,顯然有:

在上述假設下,可以得到以下數學模型:
Xij=μ+ai+bj+εij, εij~N( 0, δ2)
上式表明,X i j一方面受A、B兩因素的影響,另一方面也受許多隨機因素的影響。如果a i的影響不顯著,則所有的效應值a 1,a 2,…,a k的值都為0,否則必有一些效應值不為0;如果水平B i對總體的影響不顯著,則所有效應值b1,b2,…,bk不為0。因此,如果要檢驗因素A的作用,可建立假設:H0:a1=a2=…=ak=0;H1:a1,a2,…,ak不全為0。
總離差平方和為

上式中,S S T為總離差平方和,S S A為因素A各水平組的組平均值與總平均值之間的離差平方和,S S B是因素B的離差平方和,S S E是誤差平方和,S S E=S S T-S S A-S S B可以證明S S A與S S B是相互獨立的。SSE~X2[ ( k - 1) ( r - 1) ] ,在H0成立時,有,從而比值
,容易得知,當H0不成立時,比值F∧有增大的趨勢,因此在顯著性水平α下,若F∧>F α[ ( k- 1) ,( k-1) ( r-1) ] ,則拒絕原假設H0。同理,要檢驗因素B的作用,則可建立假設:H ′0:b 1=b 2=…=b r=0;H ′1:b 1=b 2=…=b r不全為0。
則在H′0成立時,可以證明SSB~X2( r-1) ,于是有F∧= ,因此在顯著性水平α下,若F∧>Fα[ ( k- 1) ,( k- 1) ( r- 1) ] ,則拒絕原假設H ′ 0。
筆者采用大規模調查數據,首次把居民不同人口特征置于地區、城鄉的三維框架下進行考察,對基本公共服務滿意度進行方差分析。實證表明:同一區域相似人口屬性的居民對基本公共服務滿意度評價存在顯著的城鄉差異;均為城鎮或農村戶籍的相似人口屬性的居民對基本公共服務評價存在顯著的區域差距;同一區域均是城鎮或農村戶籍的居民對基本公共服務滿意度評價存在人口學差異。
(五)數據包絡分析研究方法述評
國內部分學者也采用數據包絡分析法( DEA)研究公共服務均等化問題,如學者陳昌盛、蔡躍洲評估了各地區公共服務水平間的相對效率。(107)龔鋒實證評估了2 0 0 5年中國內地7 0個大中城市公共安全服務的供給效率。
但是,數據包絡分析法也存在較多應用短板。一是,它不能評估公共服務在地區或城鄉間的絕對效率,從而無法考證我國基本公共服務特別是農村公共服務投入不足的問題。二是,數據包絡分析是建立在評價對象的績效基礎之上的,而基本公共服務是一個綜合產品和服務,基本公共服務的評價應立足價值而不僅是建基于效率。這類工具理性的評估方法忽視了公共服務的價值尺度及公民滿意度,造成量化研究的有效性不高。