- 伍德里奇《計量經濟學導論》(第4版)筆記和課后習題詳解
- 圣才電子書
- 2579字
- 2021-05-21 22:21:41
5.2 課后習題詳解
一、習題
1.在簡單回歸模型(5.16)中,我們在前4個高斯-馬爾可夫假定下證明了形如式(5.17)的估計量是斜率β1的一致估計量。給定這樣一個估計量,定義β0的一個估計量為
證明。
證明:簡單回歸模型為:y=β0+β1x+u,則其期望值是:E(y)=β0+β1E(x)+E(u) ,或μy=β0+β1μx。因為E(u)=0,則μy=E(y),μx=E(x1)。因此β0=μy-β1μx,則,現在
,可得:
根據大數定律可知:,
,因此
。
2.數據集SMOKE.RAW包含美國成人個人隨機樣本在抽煙行為和其他變量方面的信息。變量cigs為(平均)每天抽煙的數量。你是否認為在美國這個總體中,cigs具有正態分布?試做解釋。
答:在美國這個總體中,cigs不具有正態分布。大多數人不抽煙,因此對一半以上的美國人而言,cigs=0。正態分布隨機變量的概率大于零并沒有特殊的意義。另外,cigs的分布是左偏的,而正態分布隨機變量是對稱的。
3.假設模型pctstck=β0+β1funds+β2risktol+u,滿足前4個高斯-馬爾可夫假定,其中,pctstck表示工人養老金投資于股票市場的百分比,funds表示工人可以選擇的共同基金的個數,而risktol表示對風險承受能力的某種度量(risktol越大,則表明這個人對風險的承受能力越強)。如果funds和risktol正相關,pctstck對funds簡單回歸的斜率系數有怎樣的不一致性?
答:對風險的承受能力越強,就更愿意在資本市場上投資,因此β2>0。假定可供選擇的共同基金的個數與個人承受風險的能力是正相關的,使用公式5.5,δ1>0:plim(β1)=β1+β2δ1>β1,因此有一個正的不一致性(漸進偏誤)。這個結論是有意義的,如果省略個人對風險的承受能力這一變量,而它與可選擇的共同基金個數相關,因此估計出來的funds對pctstck的影響實際上包括了risktol對pctstck的影響。
4.在滿足假定MLR.1~MLR.4的簡單回歸中,我們證明了斜率估計量是β1的一致估計。
利用證明
[你在使用β0=E(y)-β1E(X1)的同時,還需要使用
的一致性和大數定律。
證明:簡單模型為:y=β0+β1x+u,期望值是E(y)=β0+β1E(x)+E(u),或μy=β0+β1μx。因為E(u)=0,則μy=E(y),μx=E(x)。因此β0=μy-β1μx,則,根據大數定律
又
則對等式兩邊同時取概率極限得:
二、計算機習題
1.本題使用WAGE1.RAW中的數據。
(i)估計方程
wage=β0+β1educ+β2exper+β3tenure+u
保留殘差并畫出其直方圖。
(ii)以log(wage)作為因變量重做第(i)部分。
(iii)你認為是水平值—水平值模型還是對數—水平值模型更接近于滿足假定MLR.6?
答:(i)估計模型為:
526個殘差,i=1,2,…,526的直方圖如圖5-1所示,根據STATA手冊中的公式建議,對直方圖使用了27個排序格,正態分布是適合圖中描繪內容的數據分布。
圖5-1
(ii)log(wage)作為因變量的估計方程為:
從方程中推出的殘差直方圖,以及最合適的正態分布重疊圖如圖5-2所示:
圖5-2
(iii)log(wage)回歸的殘差看起來更符合正態分布,第(ii)部分的直方圖的分布密度比第(i)部分直方圖更好。wage殘差直方圖是顯著左偏的。在wage的回歸中,存在一些很大的殘差(甚至等于15),這是基于殘差平均值等于0的標準估計誤差()。在對數—水平值模型中殘差不等于0并沒有造成太大的問題,因此,對數—水平值模型更接近于滿足假定MLR.6。
2.本題使用GPA2.RAW中的數據。
(i)使用所有4137個觀測,估計方程colgpa=β0+β1hsperc+β2sat+u并以標準形式報告結論。
(ii)使用前2070個觀測再重新估計第(i)部分中的方程。
(iii)求出第(i)部分與第(ii)部分所得到的標準誤的比率。并將這個比率與式(5.10)中的結論相比較。
答:(i)4137個觀測值的回歸模型為:
(ii)使用開始的2070個觀測值的回歸模型為:
(iii)使用2070個觀測值的標準誤與使用4137個觀測值的比率為1.31。從5.10可知,,大于真實標準誤的比率。
3.在第4章的方程(4.42)中,計算檢驗motheduc和fatheduc是否聯合顯著的LM統計量。在求約束模型的殘差時一定要注意,估計約束模型所用的觀測,都包含于無約束模型所有變量可以使用的數據中。(參見例4.9。)
答:首先使用motheduc和fatheduc這兩個變量無損壞的1191個觀測值關于colgpa對cigs、parity和fatheduc回歸。此時得到殘差,再對cigsi、parityi、faminci、motheduci和fatheduci,也可以僅對motheduci和fatheduci無損壞的1191個觀測值進行回歸。回歸的判定系數
為0.0024。在1191個觀測值的基礎上,卡方分布統計量為1.191×0.0024=2.86。p值為0.239,距離F檢驗的p值0.242非常近。
4.有幾個統計量常被用于偵查潛在總體分布的非正態性。這里,我們將研究一個度量了分布偏斜程度的統計量。記得任何一個正態隨機變量都是圍繞著其均值對稱分布的。因此,如果我們把一個對稱分布的隨機變量標準化,比如z=(y-μy)/σy,其中,μy=E(y),σy=sd(y),那么,Z的均值就是0,方差為1,而且E(Z3)=0。給定一個數據樣本{yi:i=1,…,n},假定樣本均值記為,樣本標準差記為
,那么,利用
我們就可以把樣本中的yi加以標準化。(我們忽視它們是基于樣本的估計值這一事實。)度量偏斜程度的一個樣本統計量就是,或者將其中的自由度n調整為(n-1)。如果Y在總體中服從正態分布,那么,對于樣本中標準化之后的數據而言,這個偏斜指標就不應該顯著異于0。
(i)首先使用數據集40IKSUBS.RAW中具有fsize=1的那些觀測。求出inc的偏斜指標。同樣求出log(inc)的偏斜程度。哪個變量的偏斜程度更大,并因而看上去更不像正態分布?
(ii)然后使用BWGHT2.RAW。求出bwght和log(bwght)的偏斜指標。你得到什么結論?
(iii)評價如下命題:“對數變換總是使得一個恒為正的變量看上去更像正態分布。”
(iv)如果我們對回歸背景下的正態性假定感興趣,我們應該評價y和log(y)的無條件分布嗎?請給出你的解釋。
答:(i)inc的偏度為1.86。當使用log(inc)時,偏度為0.360,可知對數形式時偏度較小,這意味著其分布更接近正態分布。實際上,income的偏態分布是有據可查的。
(ii)bwght的偏度是-0.60,當采用log(bwght)時,偏度為-2.95。在這個案例中,使用自然對數之后偏度更大。
(iii)第(ii)問的案例已經明確地表明了這種狀態不一定總是正確的。采用自然對數變換可能引入偏態。從實證問題角度而言,對許多經濟變量尤其是以美元計的變量,采用對數形式通常都會有助于減少或消除偏態。但是它并不必然一定會消除。
(iv)為了進行回歸分析,應該評價條件分布,也就是說,y和log(y)在解釋變量x1,…,xk條件下的分布。如果均值分布如假定MLR.1和MLR.3提到一樣是線性的,這就相當于研究總體誤差u。實際上,這個問題中偏態的衡量常常適用于OLS回歸中的殘差分析。