- 伍德里奇《計量經濟學導論》(第4版)筆記和課后習題詳解
- 圣才電子書
- 9839字
- 2021-05-21 22:21:39
3.2 課后習題詳解
一、習題
1.用WAGE2·RAW中有關男工人的數據估計了如下方程:
其中,educ是受教育年數,sibs是兄弟姐妹的個數,meduc是母親受教育的年數,feduc則是父親受教育的年數。
(i)sibs是否具有預期的影響?請給出解釋。保持meduc、feduc不變,為了使預測的受教育程度減少一年,需要sibs增加多少?(這里不要求答案為整數。)
(ii)討論對meduc的系數的解釋。
(iii)假設一個男工人A沒有兄弟姐妹,其父母都接受了12年的教育。另一個男工人B也沒有兄弟姐妹,但其父母都接受了16年的教育。預計B和A所接受教育的年數差別為多少?
答:(i)sibs具有預期的影響。家庭中兄弟姐妹的數量越多,每一個小孩受教育的年數都會減少。為了使預測的受教育程度減少一年,需要增加?sibs=1/0.094≈10.6。
(ii)變量sibs和feduc保持不變,則母親受教育的年數每增加一年,預計受教育年數將會增加0.131年。因此母親受教育年數增加4年,她的兒子受教育年數增加約半年(0.524)。
(iii)因為兄弟姐妹的個數是相同的,但是meduc和feduc均不相同,因此B和A所接受教育的年數為:(0.131+0.210)×4=1.364(年)。
2.利用GPA2.RAW中有關4137名大學生的數據,用OLS估計了如下方程:
其中,colgpa以四分制度量,hsperc是在高中班上名次的百分位數(比方說,hsperc=5,就意味著位于班上前5%之列),而sat是在學生能力測驗中數學和語言的綜合成績。
(i)為什么hsperc的系數為負也講得通?
(ii)當hsperc=20和sat=1050時,大學GPA的預測值是多少?
(iii)假設兩個在高中班上具有同樣百分位數的高中畢業生A和B,但A學生的SAT分數要高出140分(在樣本中相當于一倍的標準差),那么,預計這兩個學生的大學GPA相差多少?這個差距大嗎?
(iv)保持hsperc不變,SAT的分數相差多少,才能導致預測的colgpa相差0.50或四分制的半分?評論你的結論。
答:(i)在高中班上名次的百分位數(hsperc)越小,學生在高中排名就越好,越大則排名越差。其它條件不變的情況下,學生在高中的排名越差,他/她預計的GPA將越小。
(ii)將hsperc=20,sat=1050代入估計方程可得:colgpa=1.392-0.0135×20+0.0148×1050=2.676。
(iii)預計中A的成績比B的成績高出0.0148×140≈0.207。這個差距較大。
(iv)hsperc不變,?colgpa=0.00148?sat。
當?colgpa=0.5時,(?sat)=0.5/(0.00148)≈338。在其他條件不變的情況下,SAT分數的差異為約2.5個標準差,才能預測colgpa相差0.50。
3.剛從法學院畢業的學生的起薪中位數由下式決定:
其中,LAST*是整個待畢業年級LAST成績的中位數,GPA是該年級大學GPA的中位數,libvol是法學院圖書館的藏書量,cost是進入法學院每年的費用,而rank是法學院的排名(rank=1的法學院是最好的)。
(i)解釋為什么我們預期β5≤0。
(ii)你預計其他斜率參數的符號如何?給出你的理由。
(iii)使用LAWSCH85.RAW中的數據,估計出來的方程是
在其他條件不變的情況下,預計GPA中位數相差一分會導致薪水有多大差別?(以百分比回答。)
(iv)解釋變量log(libvol)的系數。
(v)你是否認為,應該進入一個排名更高的法學院?從預計的起薪來看,排名相差20位的價值有多大?
答:(i)法學院的排名越大,說明該學院的聲望越差,這將使得起薪下降。例如,排名100意味著還有99所學校更好。因此預期β5≤0。
(ii)預計β1>0,β2>0,因為LAST和GPA都衡量了待畢業班級的質量,好學生進入學院使得預計的平均工資更高。β3,β4>0,法學院圖書館的藏書量以及進入法學院每年的費用都衡量了學校的質量。成本的作用小于藏書量,但反映了教員和硬件設施的質量。
(iii)預計GPA中位數相差一分會導致薪水增加24.8%。
(iv)應該進入一個排名更高的法學院。
排名相差20位的價值為:100×0.0033×20=6.6%。
4.下面這個模型是Biddle and Hamermesh(1990)所用多元回歸模型的一個簡化版本,原模型研究睡眠時間和工作時間之間的取舍,并考察影響睡眠的其他因素:
sleep=β0+β1totwrk+β2educ+β3age+u
其中,sleep和totwrk都以分鐘/周為單位,而educ和age則以年為單位。(也可參見計算機習題C2.3。)
(i)如果成年人為工作而放棄睡眠,β1的符號是什么?
(ii)你認為β2和β3的符號應該是什么?
(iii)利用SLEEP75.RAW中的數據,估計出來的方程是
如果有人一周多工作5個小時,預計sleep會減少多少分鐘?這是一個很大的舍棄嗎?
(iv)討論educ的估計系數的符號和大小。
(v)你能說totwrk,educ和age解釋了sleep的大部分變異嗎?還有什么其他因素可能影響花在睡眠上的時間?它們與totwrk可能相關嗎?
答:(i)β1的符號應該為負。
(ii)β2的符號不明確。一些人認為更高教育水平的人想獲得更多,其他條件相同的情況下,他們休息的較少,此時β2<0。睡眠與年齡之間的關系比模型描述的更為復雜,經濟學家不能很好的判斷這件事情。
(iii)因為totwrk都以分鐘/周為單位,因此將時轉化為分可得,?totwrk=5×60=300。預計睡眠將會下降0.148×300=44.4(分)。對一周而言,這并不是一個很大的舍棄。
(iv)受教育年限educ越多暗示著預計睡眠時間越少,但是這種影響是很小的。假設在其他條件不變的情況下,大學和高中的區別是四年間大學學生每周睡眠時間少休息45分鐘。
(v)不能,totwrk、educ和age只解釋了11.3%的sleep的變異。一個包含在誤差項中的重要因素是總體健康狀況。另一個重要因素是婚姻狀況,以及是否有孩子。健康、婚姻狀況、孩子的數量和年齡與totwrk是相關的。
5.考慮含有三個自變量的多元回歸模型,并滿足假定MLR.1~MLR.4,y=β0+β1x1+β2x2+β3x3+u,你對估計x1和x2的參數之和感興趣;把這個和記為θ1=β1+β2。
(i)證明是θ1的一個無偏估計量。
(ii)求出用、
和
表示的
。
答:(i)
(ii)。
6.在一項調查大學GPA與在各種活動中折耗費時間之關系的研究中,你對幾個學生分發了調查問卷。學生被問到,他們每周在學習、睡覺、工作和閑暇這四種活動中各花多少小時。任何活動都被列為這四種活動之一,所以對每個學生來說,這四個活動的小時數之和都是168。
(i)在模型GPA=β0+β1study+β2sleep+β3work+β4leisure+u中,保持sleep,work和leisure不變而改變study是否有意義?
(ii)解釋為什么這個模型違背了假定MLR.3。
(iii)你如何才能將這個模型重新表述,使得它的參數具有一個有用的解釋,而又不違背假定MLR.3。
答:(i)沒有意義。因為四種活動的總時間固定為168小時,其他三種不變,則study時間也不會改變。
(ii)從(i)可知,study是其他三種活動的線性函數:study=168-sleep-work-leisure。這種關系對于每一個觀測值都成立,因此違背了MLR.3。
(iii)應該去掉一個解釋變量leisure,模型變為:
GPA=β0+β1study+β2sleep+β3work+u
β1是study的參數,當其他條件不變的情況下,study每增加一小時,GPA增加β1。但是如果學習時間增加一小時,leisure時間必須減少一小時。其他參數解釋與此類似。
7.假設制造業中每個工人的平均生產力(avgprod)取決于培訓的平均小時數(avgtrain)和工人的平均能力(avgabil)兩個因素:avgprod=β0+β1avgtrain+β2avgabil+u,假設這個方程滿足高斯-馬爾可夫假定。如果將培訓津貼給了那些工人能力較差的企業,以致avgtrain和avgabil呈負相關,那么,將avgprod對avgtrain進行簡單回歸所得到的可能出現什么樣的偏誤?
答:利用表3-2。因為β2>0,且Corr(x1,x2)<0。因此存在一個向下的偏誤,即
。簡單回歸估計低估了培訓時間的影響。即使β1>0,
也可能是負的。
8.下面哪些因素會導致OLS估計量出現偏誤?
(i)異方差性。
(ii)遺漏一個重要變量。
(iii)模型中同時包含的兩個自變量之間的樣本相關系數達到0.95。
答:只有(ii)才會導致OLS出現偏誤,且所遺漏的變量必須與模型中包含的變量是相關的。同方差性假設并不影響OLS估計量的無偏性,僅影響估計量的方差。樣本解釋變量之間共線性的程度并不影響高斯—馬爾科夫假定。只有當自變量之間完全共線時,才會違背MLR.3。
9.假設你對估計其他條件不變情況下y和x1之間的關系感興趣。為此,你可以搜集兩個控制變量x2和x3的數據。(為真實起見,你可以想象y為期末考試分數,x1為到課率。x2為上學期之前的GPA,x3為SAT或ACT分數。)令表示y列x1進行簡單回歸的系數估計值,而
為y對x1,x2,x3進行多元回歸的斜率估計值。
(i)若樣本中x1與x2和x3高度相關,且x2和x3對y具有很大的偏效應,預計和
是十分類似還是十分不同?請解釋。
(ii)若x1與x2和x3幾乎無關但x2和x3高度相關,預計和
是十分類似還是十分不同?請解釋。
(iii)若樣本中x1與x2和x3高度相關,且x2和x3對y具有很小的偏效應,預計和
哪個更小?請解釋。
(iv)若x1與x2和x3幾乎無關,x2和x3對y具有很大的偏效應,并且x2與x3高度相關,預計和
哪個更小?請解釋。
答:(i)因為x1與x2和x3高度相關,后面的變量對具有很大的偏效應,簡單和多元回歸中x1的系數十分不同。由方程3.46以及對遺漏一個變量的討論可知,系數不相同是直覺的結論。
(ii)若x1與x2和x3幾乎無關但x2和x3高度相關,預計和
十分類似。因為x1與x2和x3幾乎無關,則x2和x3的相關程度對多元回歸中對x1的回歸估計沒有直接的影響。
(iii)更小。在本案例中,加入x2和x3大幅度增加了x1的系數的標準誤,因此
。
(iv)更小。在模型中加入x2和x3將會減少殘差,而不導致多重共線性,因此可得
。x2和x3的相關關系并不影響
。
10.假設決定y的總體模型是y=β0+β1x1+β2x2+β3x3+u,而這個模型滿足假定MLR.1~MLR.4。但我們估計了漏掉x3的模型。令,
和
為y對x2和x3回歸的OLS估計量。(給定樣本中自變量的值)證明
的期望值是
其中是x1對x2回歸所得到的OLS殘差。[提示:
的公式來自方程(3.22)。將yi=β0+β1xi1+β2xi2+β3xi3+ui代入這個方程。經過一些計算之后,將xi3和
視為非隨機量而取期望。]
答:由公式3.22可得:
代入真實的模型可得:
因為,
,
,
是xi1對xi2回歸的殘差,
有零均值,且與xi2無關。因此分子簡化為
將分子代入原式得:
由于隨機誤差項的均值為0,因此
11.下面這個方程把一個社區住房的中間價格表示成污染水平(用nox表示氧化亞氮)和社區中每套住房平均房間數量(rooms)之間的關系:log(price)=β0+β1log(nox)+β2rooms+u。
(i)β1和β2的符號可能是什么?對β1有何解釋?請加以說明。
(ii)為什么nox[或更準確地說,是log(nox)]與rooms可能負相關?如果是這樣,將log(price)對log(nox)進行簡單回歸得到β1的偏誤估計量是偏高還是偏低?
(iii)利用HPRICE2.RAW中的數據,估計出如下方程:
根據你在第(ii)部分的回答,就price對nox的彈性估計值而言,上述簡單回歸結果和多元回歸結果之間的關系與你的預期一致嗎?這個結果是否意味著-0.718比-1.043更加接近真實彈性?
答:(i)β1<0,更高的污染水平導致預計房屋價格更低。β1表示房屋價格的污染彈性,即污染水平上升1%,則房屋價格下降β1%。
β2>0,每套住房平均房間數量越多,說明房屋面積越大,則房屋價格越高。
(ii)假設平均房間數量隨著房屋質量的提高而增長,log(nox)與rooms可能負相關,因為實際上貧窮的社區污染水平更高。利用表3.2可判斷偏誤的方向,如果β2>0且Corr(x1,x2)<0,簡單回歸估計得到的有一個向下的偏誤。當β1<0,意味著在同樣的回歸中,平均污染水平的作用
被高估了。
(iii)上述簡單回歸結果和多元回歸結果之間的關系與預期一致。簡單回歸估計的結果-1.043小于多元回歸的結果-0.718。如果這些估計只是對于一個樣本而言,那么就不能判斷哪一個更接近β1,但如果這是一個典型的樣本,則-0.718更接近真實的β1。
12.(i)在前4個高斯-馬爾可夫假定之下,考慮簡單回歸模型y=β0+β1x1+u,對某個函數g(z),比如g(x)=x2或g(x)=log(1+x2)。定義zi=g(xi)定義一個斜率估計量為
證明是線性無偏的。記住,在你的推導過程中,因為
,所以你可以把xi和zi都看成非隨機的。
(ii)增加同方差假定MLR.5,證明
(iii)在高斯-馬爾可夫假定下,直接證明,其中
是OLS估計量。[提示:附錄8中的柯西—施瓦茲不等式意味著
注意,我們可以將從樣本協方差中去掉。
證明:(i)記,這不完全是z和x樣本協方差,因為并沒有除以n-1。但為了簡化計算而使用它。由此可知:
這是一個yi的線性函數,設權重為
為了表示無偏性,將yi=β0+β1xi+u加入該方程可得:
因為,szx是zi、xi和預計期望值的函數。對于所有的i,都有E(ui)=0。因此可得:
(ii)據(i)可得:
(iii)已知
將從樣本協方差中去掉,消去n-1,可以得到:
兩邊乘以σ2,可得。
13.如下式所示,在由美國各個縣構成的總體中,各種稅收比例對隨后就業增長方面的影響:growth=β0+β1shareP+β2shareI+β3shareS+其他因素,其中,growth是就業從1980年到1990年的變化百分比,shareP是總稅收收益中財產稅的比例,shareI是所得稅稅收收益的比例,而shareS是銷售稅稅收收益的比例。所有這些變量都以1980年的貨幣度量。遺漏的比例shareF包括收費和雜項稅收。根據定義,這四個比例之和為1。其他因素將包括對教育、基礎設施等支出(均以1980年貨幣度量)。
(i)我們為什么必須從方程中省略一個稅收比例變量?
(ii)對β1給出一個仔細的解釋。
答:(i)四種稅收的比例之和為1,如果不省略一種稅收的比例,方程就會遭遇完全共線性。參數不存在“其他條件不變”的情況,也就是說,只改變一種稅收的比例不可能維持所有其他的變量保持不變。
(ii)因為每一種稅收分擔一個比例(最大為1,此時其他稅收所占份額為0),因此增加1單位的財產稅收益比例shareP是無意義的。如果shareP增加1%,保持其他因素不變的情況下,growth下降β1%。
二、計算機習題
1.衛生官員(和其他人)所關心的一個問題是,孕婦在懷孕期間抽煙對嬰兒健康的影響。對嬰兒健康的度量方法之一是嬰兒出生時的體重;過低的出生體重會使嬰兒有感染各種疾病的危險。由于除了抽煙之外,其他影響嬰兒出生體重的因素可能與抽煙相關,所以我們應該考慮這些因素。比如,高收入通常會使母親得到更好的產前照顧和更好的營養。表達這一點的方程是bwght=β0+β1cigs+β2faminc+u。
(i)β2的符號最可能是什么?
(ii)你是否認為cigs與faminc可能相關?解釋為什么可能是正相關或負相關。
(iii)現在利用BWGHT.RAW中的數據分別估計包含和不包含faminc的方程。以方程的形式報告結論,包括樣本容量和R2。討論你的結論,主要看增加faminc是否會顯著改變cigs對bwght 的估計影響。
答:(i)β2>0。高收入通常會使母親得到更好的產前照顧和更好的營養,從而使得出生體重較大。
(ii)一方面,收入的增加會使得商品的消費增加,因此兩者是正相關關系。另一方面,家庭收入越高,家庭成員所受的教育越高,吸煙的可能性越低,因此收入與吸煙是呈反相關關系的。實際上,樣本中兩者呈負相關關系,相關系數為-0.173。
(iii)不包含和包含變量faminc的方程分別為:bwght=119.77-0.514cigs,n=1.388,R2=0.023及bwght=116.97-0.463cigs+0.093faminc,n=1.388,R2=0.030。
可以看出,加入變量faminc的回歸中,吸煙的影響較小,但兩者的差別不大。這是因為吸煙和家庭收入之間并不是非常相關,而faminc的系數實際上是非常小的,1988年10000美元的家庭收入增長使得預計出生體重僅增加0.093盎司。
2.使用HPRICE1.RAW中的數據,估計如下模型:price=β0+β1sqrft+β2bdrms+u,其中,price是以千美元為單位的住房價格。
(i)以方程的形式寫出結果。
(ii)住房在保持面積不變的同時又增加一間臥室,估計其價格會提高多少?
(iii)住房增加一間大小為140平方英尺的臥室,估計其價格會提高多少?將這個答案與你在第(ii)部分的答案相比較。
(iv)價格的變異有多大比例能被平方英尺數和臥室數解釋?
(v)樣本中的第一套住房有sqrft=24.38和bdrms=4。從OLS回歸線計算這套住房的預計銷售價格。
(vi)樣本中第一套住房的實際銷售價格是300000美元(price=300)。求出這套住房的殘差。它是否表明購買者為這套住房支付了過低或過高的價格?
答:(i)估計方程為:price=-19.32+0.128sqrft+15.20bdrms,n=88,R2=0.632。
(ii)其價格會提高?price=15.20?bdrms=15.2,即15200美元。
(iii)估計其價格會提高?price=0.128?sqrft+15.20?bdrms=0.128(140)+15.2=33.12,即33120美元。
(iv)價格的變異有63.2%能被平方英尺數和臥室數解釋。
(v)這套住房的預計銷售價格為:-19.32+0.128×2438+15.2×4=353.544,即353544美元。
(vi)實際銷售價格為300000美元,預計價格為353544美元,殘差為實際觀察值與回歸估計值的差,即-53544美元。購買者為這套住房支付了過低的價格。當然,還存在一些其他的因素影響房屋的價格,模型并未將這些因素完全納入進來。
3.文件CEOSAL2.RAW包含了177位首席執行官的數據,并可用來考察企業業績對CEO薪水的影響。
(i)估計一個將年薪與企業銷售量和市場價值相聯系的模型。讓這個模型對每個自變量的變化都具有常彈性。以方程的形式寫出結論。
(ii)在第(i)部分的模型中增加profits。為什么這個變量不能以對數形式進入模型?你認為這些企業業績變量解釋了CEO薪水變異中的大部分嗎?
(iii)在第(ii)部分的模型中增加ceoten。保持其他條件不變,延長一年CEO任期,估計的百分比回報是什么?
(iv)求出變量log(mktval)和profits之間的樣本相關系數。這些變量高度相關嗎?這對OLS估計量有什么影響?
答:(i)常彈性方程為:
log(salary)=4.62+0.162log(sales)+0.107(mktval)
n=177,R2=0.299
(ii)profits不能以對數形式進入模型的原因在于:樣本中的9個公司的利潤為負,如果采用對數形式,將會在模型中丟失這些數據。估計模型如下:
log(salary)=4.69+0.161log(sales)+0.098log(mktval)+0.000036profits
n=177,R2=0.299
企業業績變量僅解釋了CEO薪水變異中的30%。
(iii)加入變量ceoten后的模型為:
log(salary)=4.56+0.162log(sales)+0.102log(mktval)+0.000029profits+0.012ceoten
n=177,R2=0.318
延長一年CEO任期,估計的百分比回報是1.2%。
(iv)變量log(mktval)和profits之間的樣本相關系數是0.78,這是高度相關的。這對OLS估計量的無偏性是無影響的,但會使它們的方差增大。
4.本題使用ATTEND.RAW中的數據。
(i)求出變量atndrte,priGPA和ACT的最小值、最大值和平均值。
(ii)估計模型atndrte=β0+β1priGPA+β2ACT+u,并以方程的形式寫出結論。對截距做出解釋。它是否存在一個有用的含義。
(iii)討論估計的斜率系數。有沒有什么令人吃驚之處?
(iv)如果priGPA=3.65和ACT=20,預計atndrte是多少?你對這個結論做何解釋?樣本中有沒有一些學生具有這些解釋變量的值?
(v)如果學生A具有priGPA=3.1和ACT=21,而學生B具有priGPA=2.1和ACT=26,他們在出勤率上的預期差異是多少?
答:(i)atndrte,priGPA和ACT的平均值、最小值和最大值如表3-2所示:
表3-2
(ii)估計方程為:atndrte=75.70+17.26priGPA-1.72ACT,n=680,R2=0.291。
截距的含義是,當priGPA和ACT為0時,預計的atndrte為75.5%。實際上在大學里面沒有學生的priGPA和ACT為0。對總體而言不存在一個有用的含義。
(iii)priGPA的系數意味著,在ACT保持不變的前提下,學生的priGPA系數提高1%,atndrte將增加17.3%。ACT的系數為負,最初是令人吃驚的。在priGPA給定的前提下,ACT提高5%,預計的atndrte將下降8.6%。
(iv)預計atndrte=75.70+17.267(3.65)-1.72(20)≈104.3。學生的出勤率不可能超過100%。當用回歸方法對因變量的上界和下界進行預測時可能出現這樣的情況,實際上樣本中學生的真實出勤率為87.5%。
(v)A和B在出勤率上的預期差異是:17.26×(3.1-2.1)-(21-26)=25.86。
5.通過對例3.2明確地進行“排除其他影響”的練習,證實對OLS估計值做“排除其他影響”的解釋。這首先要求將educ對exper和tenure進行回歸,并保留殘差然后將log(wage)對
進行回歸。將
的系數與在log(wage)對educ、exper和tenure的回歸中educ的系數相比較。
答:educ對exper和tenure進行回歸的模型為:
保留殘差然后將log(wage)對
進行回歸的模型為:
在第二個回歸模型中,系數與公式3.19中educ的系數相等。以上回歸的判定系數小于3.19的R2。log(wage)對
的回歸解釋了educ中與exper和tenure無關的部分。exper和tenure的獨立效應沒有包括在內。
6.本題使用WAGE2.RAW中的數據。一般地,保證如下所有回歸都含有截距。
(i)將IQ對educ進行簡單回歸,并得到斜率系數。
(ii)將log(wage)對educ進行簡單回歸,并得到斜率系數。
(iii)將log(wage)對educ和IQ進行多元回歸,并分別得到斜率系數和
。
(iv)驗證。
答:(i)斜率系數。
(ii)斜率系數。
(iii)斜率系數和
。
(iv)
這與是非常接近的。較小的差距可看作為舍入誤差。
7.本題利用MEAP93.RAW中的數據。
(i)估計模型math10=β0+β1log(expend)+β2Inchprg+u,并按照通常的方式報告估計方程,包括樣本容量和R2。斜率系數的符號與你的預期一致嗎?請加以解釋。
(ii)你如何理解第(i)部分中估計出來的截距?特別是,令兩個解釋變量都等于零說得過去嗎?[提示:記住log(1)=0。]
(iii)現在做math10對log(expend)的簡單回歸,并將斜率系數與第(i)部分中得到的估計值進行比較。與第(i)部分中的結果相比,這里估計出來的支出效應是更大還是更小?
(iv)求出lexpend=log(expend)與Inchprg之間的相關系數。你認為其符號合理嗎?
(v)利用第(iv)部分的結果來解釋你在第(iii)部分中得到的結論。
答:(i)回歸結果是:
math10=-20.36+6.231log(expend)-0.305Inchprg
n=408,R2=0.180
估計的斜率系數符號符合預期,即更多的支出導致通過率的增加,更高的貧困率導致通過率的下降。
(ii)截距是指其他解釋變量為0時,被解釋變量的估計值。當貧困率很低的時候,設定Inchprg=0是有意義的。設定log(expend)為0是無意義的,因為這意味著expend為1,而且支出是以美元計的。-20%的預測通過率是無意義的。
(iii)簡單回歸模型結果為:
math10=-69.34+11.16log(expend)
n=408,R2=0.030
其斜率系數是第(i)部分的結果的兩倍。因此這里估計出來的支出效應更大。
(iv)log(expend)與Inchprg之間的相關系數為-0.19,這意味著,在平均水平上,較窮的高中在每個學生身上的支出更少。這是有意義的,尤其是在1993年的密歇根,學校基金是由當地的稅收收入決定的。
(v)可以使用公式3.23,因為Corr(x1,x2)<0,這意味著,
。簡單回歸估計中的系數
大于多元回歸中的
。沒有成功解釋貧窮率使得支出的效應被高估。
8.利用DIS(RIM.RAW中的數據回答本題。對新澤西和賓夕法尼亞的各個郵區,搜集快餐店各種商品價格和人口特征方面的數據。目的是想考察快餐店是否在黑人更集中的區域收取更高的價格。
(i)求出樣本中prpblck和income的平均值及其標準差。prpblck和income的度量單位是什么?
(ii)考慮一個模型,用人口中黑人比例和收入中位數來解釋蘇打飲料的價格psoda;psoda=β0+β1prpblck+β2income+u。用OLS估計這個模型并以方程的形式報告結果,包括樣本容量和R2。(報告估計值時不要使用科學計數法。)解釋prpblck的系數。你認為它在經濟上算大嗎?
(iii)將第(ii)部分得到的估計值與psoda對prpblck進行簡單回歸得到的估計值進行比較。控制收入變量后,這種歧視效應是更大還是更小了?
(iv)收入價格彈性為常數的模型可能更加適合。報告如下模型的估計值:
log(psoda)=β0+β1prpblck+β2income+u
若prpblck提高0.20(即20個百分點),估計psoda的變化百分比是多少?[提示:答案是2.xx,你在“xx”位置上填寫數字即可。]
(v)現在在第(iv)部分的回歸中添加變量prppov。有何變化?
(vi)求出log(income) 和prppov的相關系數。大致符合你的預期嗎?
(vii)評價如下說法:“由于log(income)和prppov如此高度相關,所以它們不該進入同一個回歸。”
答:(i)樣本中prpblck平均值為0.113,標準差為0.182;income的平均值為47053.78,標準差為13179.29。prpblck的度量單位是比例,而收入的度量單位是美元。
(ii)OLS回歸結果是:
psoda=0.956+0.115prpblck+0.00000income
n=401,R2=0.064
prpblck增加了10個百分點,soda的預計價格將增加0.0115美元。它在經濟上不算大。在無黑人的地區和其他幾乎全部是黑人的地區,soda價格的差異大約是11.5美分。
(iii)簡單回歸估計中,prpblck的系數為0.065,因此簡單回歸估計的系數更低。這是因為prpblck和income是負相關的,而收入變量在多元回歸中的系數為正。控制收入效應后,歧視效應變大了。
(iv)模型結果為:
log(psoda)=-0.794+0.122prpblck+0.077log(income)
n=401,R2=0.068
若prpblck提高0.20(即20個百分點),估計psoda的變化百分比是0.20×0.122=0.0244,即2.44%。
(v)添加變量prppov,下降為0.073。
(vi)log(income)和prppov的相關系數為-0.84,因為貧困率是由收入決定的。
(vii)log(income)和prppov之間的確是高度相關的,但是為了能夠分離出純粹的歧視效應,在模型中需要包含盡可能多的衡量收入的因素,因此模型中包含這兩個變量是有意義的,即他們可以進入一個回歸。
9.利用CHARITY.RAW中的數據回答如下問題
(i)用普通最小二乘法估計如下模型:
gift=β0+β1mailsyear+β2giftlast+β3propresp+u
按照通常的方式報告估計方程,包括樣本容量和R2。其R2與不使用giftlast和propresp的簡單回歸所得到的R2相比如何?
(ii)解釋mailsyear的系數,它比對應的簡單回歸系數更大還是更小?
(iii)解釋propresp的系數,千萬要注意propresp的度量單位。
(iv)現在,在這個方程中增加變量avggif。這將對mailsyear的估計效應造成什么樣的影響?
(v)在第(iv)部分的方程中,giftlast的系數有何變化?你認為這是怎么回事?
答:(i)估計模型為:
gift=-4.55+2.17mailsyear+0.0059giftlast+15.36propresp
n=4268,R2=0.0834
與簡單回歸的R2=0.0834相比較大,能夠解釋更大部分的gift變異。
(ii)保持其他變量不變,mailsyear每增加1,估計的gift將增加2.17荷蘭盾。簡單回歸系數為2.65,因此多元回歸估計系數較小。
(iii)propresp是以比例計的,增加1是無意義的。這種增長只會發生在propresp 從0增加到1時。設想propresp增長10個百分點,則預計gift將增加1.54荷蘭盾。
(iv)估計結果為:
gift=-7.33+1.20mailsyear-0.261giftlast+16.20propresp+0.527avggift
n=4268,R2=0.2005
mailsyear的系數變小為1.2,比簡單回歸估計模型中的回歸系數少一半。
(v)giftlast的系數符號變為負,當人們可能在較大的捐贈之后選擇較小的捐贈,那么過去的捐贈越多,意味著現在的捐贈將會減小,因此這種負相關關系是有意義的。
- 2019年上海市選聘高校畢業生到村任職考試《綜合知識和能力》考點精講及典型題(含歷年真題)詳解
- 3ds Max 環境藝術創新設計技法
- 高等分析化學
- STM32嵌入式系統設計與應用
- 2019年經濟師《工商管理專業知識與實務(初級)》復習全書【要點精講+歷年真題詳解】
- 陳剛《網絡廣告》筆記和課后習題詳解
- 聲探測原理
- 2020年全國法律碩士《398法碩聯考專業基礎(非法學)民法學部分》過關必做習題集(含歷年考研真題)【視頻講解】
- 數控編程與加工技術
- 多媒體技術及應用案例教程
- 化工計算與軟件應用 第二版
- 中國地質大學(武漢)外國語學院242俄語(二外)歷年考研真題及詳解
- 民事訴訟實務教程
- 高鴻業《西方經濟學(微觀部分)》(第7版)課后習題詳解
- 北京外國語大學212翻譯碩士俄語[專業碩士]歷年考研真題及詳解