書名: 伍德里奇《計量經濟學導論》(第4版)筆記和課后習題詳解作者名: 圣才電子書本章字數: 3325字更新時間: 2021-05-21 22:21:36
1.2 課后習題詳解
一、習題
1.假設你所在的大學要求你“找出每周學習小時數(study)和每周工作小時數(work)之間的關系”。把這個問題說成“推斷study是否‘導致’work或work是否‘導致’study”的問題是否講得通?請解釋。
答:把這個問題描述為因果關系是無意義的。經濟學家會假設學生理性的選擇學習時間和工作時間(以及其他活動,如上課、娛樂和休息)的組合,使得他們在每周總共168小時的時間約束下獲得最大的效用。可以使用統計方法如回歸分析方法去衡量學習和工作時間之間的關系,但是不能判斷哪一個變量“導致”另一個變量。他們同屬于學生選擇的變量之一。
2.假設讓你進行一項研究,以確定較小的班級規模是否會提高四年級學生的成績。
(i)如果你能設定你想做的任何實驗,你想做些什么?請具體說明。
(ii)更現實地,假設你能搜集到某個州幾千名四年級學生的觀測數據。你能得到他們四年級班級規模和四年級末的標準化考試分數。你為什么預計班級規模與考試成績存在負相關關系?
(iii)負相關關系一定意味著較小的班級規模會導致更好的成績嗎?請解釋。
答:(i)假定能夠隨機的分配學生們去不同規模的班級,也就是說,在不考慮學生諸如能力和家庭背景等特征的前提下,每個學生被隨機的分配到不同的班級。因此可以看到班級規模(在倫理考量和資源約束條件下的主體)的顯著差異。
(ii)負相關關系意味著更大的班級規模與更差的考試成績是有直接聯系的,因此可以發現班級規模越大,導致考試成績越差。
通過數據可知,兩者之間的負相關關系還有其他的原因。例如,富裕家庭的孩子在學校可能更多的加入小班,而且他們的成績優于平均水平。
另外一個可能性是:學校的原則是將成績較好的學生分配到小班。或者部分父母可能堅持讓自己的孩子進入更小的班級,而同樣這些父母也更多的參與子女的教育。
(iii)鑒于潛在的其他混雜因素(如ii所列舉),負相關關系并不一定意味著較小的班級規模會導致更好的成績。控制混雜因素的方法是必要的,而這正是多重回歸分析的主題。
3.工作培訓項目的理由之一是能提高工人的生產力。假設要求你評估更多的工作培訓是否使工人更有生產力。不過,你沒有工人的個人數據,而是有俄亥俄州制造企業的數據。具體而言,對每個企業,你都有人均工作培訓小時數(training)和單位工時生產的合格產品數(out put)方面的信息。
(i)仔細陳述這個政策問題背后其他情況不變的思維試驗。
(ii)一個企業培訓其員工的決策看起來有可能獨立于工人特征嗎?工人可觀測與不可觀測的特征各有哪些?
(iii)除工人特征之外,再列出一個影響工人生產力的因素。
(iv)你若發現training和out put之間有正相關關系,你令人信服地證明了工作培訓能提高工人的生產力了嗎?請解釋。
答:(i)其他情況不變的思維在本題可以假設兩個廠商A、B,廠商A除了對每個工人提供比廠商B更多的職業培訓外,其他條件與廠商B都是相同的,由此可以得出廠商A的產出與廠商B的產出的不同。
(ii)一個企業培訓其員工的決策看起來依賴于工人特征。
可觀測的特征包括:工作年限、學歷、專業工作經驗,甚至包括年齡、性別和種族。
不可觀測的特征包括:企業可能根據能力高低來為員工提供培訓,但是“能力”是難以量化的,經理只能根據不同員工能力相關的方面來作出判斷。另外,不同類型的員工可能被更高的平均培訓時間所吸引,這對雇主而言是不明顯的。
(iii)工人可獲得的資本和技術的數量也影響產出。如果兩個企業采用不同的資本或技術,即使他們擁有相同類型的員工,他們的產出也將會不同。經理的質量同樣也是影響產出的因素之一。
(iv)并沒有,除非培訓量是隨機分配的。即使培訓不能促進工人的生產率提高,ii和iii所列的因素也能導致培訓和產出之間呈現正相關關系。
二、計算機習題
1.本題使用WAGE1.RAW中的數據。
(i)求出樣本中的平均受教育程度。最低和最高受教育年數是多少?
(ii)求出樣本中的平均小時工資。它看起來是高是低?
(iii)工資數據用1976年的美元報告。利用(2004年或以后的)《總統經濟報告》,求出并報告1976年和2003年的消費者價格指數(CPI)。
(iv)利用第(iii)部分中的CPI值,求以2003年美元度量的平均小時工資。現在,平均小時工資看起來合理了嗎?
(v)樣本中有多少女人和男人?
答:(i)樣本中的平均受教育程度為12.6年。最低受教育年數為0,最高受教育年限為18年。
(ii)平均小時工資為5.9美元,在2008年它看起來是低的。
(iii)1976年的CPI為56.9,而2003年的CPI為184。
(iv)將1976年美元轉換成2003年美元,應該使用CPI的比率,即184/56.9≈3.23。此以2003年美元度量的平均小時工資為:5.9×3.23≈19.06(美元)。這是比較合理的工資水平。
(v)樣本中有252個女人,274個男人。
2.回答本題需使用BWGHT.RAW中的數據。
(i)樣本中有多少婦女,又有多少人報告在懷孕期間抽煙?
(ii)平均每天抽煙數量是多少?平均數作為這個案例中“典型”婦女的度量指標好嗎?請解釋。
(iii)懷孕期間抽煙的婦女中,平均每天抽煙數量是多少?與第(ii)部分中的答案有何區別,為什么?
(iv)求出樣本中fatheduc的平均值。為何只用1192個觀測計算這個平均值?
(v)報告平均家庭收入及其標準誤,以美元為單位。
答:(i)樣本中有1388個婦女。有218個婦女報告在懷孕期間抽煙。
(ii)平均每天抽煙數量為2.09。但是樣本包含了1176個不吸煙的婦女。報告只是掩蓋了85%的婦女不吸煙的事實。在懷孕期間不吸煙的女人作為“典型”婦女的度量指標將更有意義,此時吸煙的平均數量為0。
(iii)懷孕期間抽煙的婦女中,平均每天抽煙數量為13.7,這高于將所有的婦女作為樣本總值得出的平均值。
(iv)fatheduc的平均值為13.2。因為有196個fatheduc的觀測數據丟失了,而且這些數據在計算平均值是必要的。
(v)平均家庭收入為29027美元,標準誤為18739美元。
3.MEAPO1.RAW中的數據是2001年密歇根州的數據。利用這些數據回答如下問題。
(i)求出math4的最大值和最小值。這個范圍合理嗎?請解釋。
(ii)有多少學校在數學測試中有100%的通過率?占整個樣本的百分比是多少?
(iii)有多少學校的數學通過率剛好是50%?
(iv)比較數學和閱讀的平均通過率。哪個測試更難通過?
(v)求出math4和read4之間的相關系數。你得到的結論是什么?
(vi)變量exppp是平均每個學生的支出。求出exppp的平均值和標準差。你認為學生均支出存在大幅差異嗎?
(vii)假設學校A平均每個學生支出6000美元,學校B平均每個學生支出5500美元。學校A的支出超過學校B的支出百分之多少?與根據自然對數之差近似的百分比差異100×[log(6000)-log(5500)]進行比較。(參見附錄A中的A.4節。)
答:(i)math4的最大值為100,最小值為0。
(ii)有38個學校在數學測試中有100%的通過率,所占比為:38/1823≈2.1%。
(iii)有17個學校在數學測試中有50%的通過率。
(iv)math4的通過率是71.9,read4的通過率是60.1。在2001年,read4更難通過。
(v)math4和read4之間的相關系數為0.843,說明兩者之間具有高度相關的線性關系。也就是說,一所在一門課程中具有很高通過率的學校在其他課程上具有很高通過率的趨勢是很強的。
(vi)變量exppp的平均值是5194.87美元。標準差是1091.89美元,這表示學生均教育支出是存在較大的差別的。
(vii)學校A超出學校B的支出百分比是:(6000-5500)/5500≈9.1%。[log(6000)-log(5500)]≈3.8%。
4.JTRAIN2.RAW中的數據,來自1976~1977年對低收入男性進行的一項工作培訓試驗;參見Lalonde(1986)。
(i)利用指標變量train來確定得到工作培訓的男性比例。
(ii)變量re78是1978年得到的工資,以1982年的千美元度量。針對得到工作培訓的男性樣本和未得到工作培訓的男性樣本,分別計算re78的平均值。二者在經濟上的差別大嗎?
(iii)變量unem78是表示一個男人在1978年是否失業的指標變量。得到工作培訓者的失業比例是多少?沒有得到工作培訓者呢?評論二者之間的差異。
(iv)根據第(ii)部分和第(iii)部分,工作培訓項目看來有效嗎?如何使我們的結論更有說服力?
答:(i)得到工作培訓的男性比例為:185/445≈41.6%。
(ii)針對得到工作培訓的男性樣本,re78的平均值為6350美元;針對未得到工作培訓的男性樣本,re78的平均值為4550美元。兩者之間的差異為1800美元,這是非常大的差異。平均而言,接受工作培訓的男性的收入比未接受工作培訓的男性多40%。
(iii)得到工作培訓者1978年的失業比例為24.3%;未得到工作培訓者1978年的失業比例為35.4%,兩者之間的差距仍然很大。
(iv)從失業率和收入的差距可以看出,工作培訓項目看來有效。為了使結論更具有說服力,應該建立統計意義上的顯著模型。