官术网_书友最值得收藏!

2.2 因果關系和相關關系

不幸的是,即使是基于大型數據集的分析也可能具有誤導性。以我們之前提到的教育回報模型為例。基于有關工資和受教育年限的大數據集,我們已經看到,平均而言人們每多接受1年教育,工資大概會增加10%。這是不是意味著只要你在學校多待1年,就一定會讓你未來的工資增加10%?不一定。讓我們通過一個例子來思考為什么情況并非總是如此。

紅色廣告的故事

假設有一家百貨商場聘請你擔任顧問。你提出了一條關于廣告活動的假說:在廣告活動中使用紅色能更好地吸引人們的眼球。為了驗證你的假說,你從過往的廣告活動中搜集證據,包括這些廣告活動的主色調以及活動期間商場的銷售額變化。

結果,你的實證研究證實了自己的假說!在使用了大量紅色圖片的廣告活動期間,商場的銷售額上升了25%;在使用了大量藍色圖片的廣告活動期間,商場銷售額只上升了5%。你跑到CEO那里報告這一非凡結果。你真是一個天才!

不幸的是,CEO當場解雇了你。他注意到了什么被你遺漏的東西?

紅色主題的廣告活動大部分集中在圣誕季,而藍色主題的廣告活動則分布于一年中的其余任意時間。正如這位CEO所說:“并不是在廣告活動中使用紅色使我們的收入增加,而是圣誕季使我們的收入增加。是因為圣誕季,我們才在廣告活動中更多地使用紅色。即使我們在圣誕季推出藍色主題的廣告活動,我們的收入仍會上升約25%。”

這是一個真實的故事,當然出于保護這位朋友的目的,我們修改了故事的細節,并且隱去了這家商場的名字。在本章附錄中,我們還會講一個相關的故事,那個故事中的CEO并不像這個故事中的CEO這樣敏銳。

因果關系與相關關系

如同上述案例中錯誤的廣告分析一樣,人們經常會把相關關系誤以為是因果關系。當一件事直接影響另一件事時,就會產生因果關系你可以把因果關系看成從原因到結果的路徑:打開爐灶一段時間就會使水壺里的水沸騰。

科學家把變化的因素或特征稱為變量,比如燒水壺里水的溫度。科學家稱,當一個變量(例如在爐灶上天然氣的燃燒量)引發另一個變量(例如燒水壺里水的溫度)改變時,就會產生因果關系。

相關關系意味著兩個變量趨向于同時改變——當一個變量改變時,另一個變量也會改變。它們之間存在某種關系。這種關系可能是因果關系,即使不存在因果關系,也可能存在相關關系。例如,上音樂課的學生在SAT(美國高中畢業生學術能力水平考試)測驗中的得分高于不上音樂課的學生。于是,一些音樂教育家很開心地由此得出因果關系的結論:學生多上音樂課能夠提升SAT成績。

但是,請不要著急給你的弟弟妹妹買樂器。這個因果關系缺少足夠證據,而且上音樂課和SAT成績的相關關系還有很多其他可能的解釋。

從原因到結果。爐灶上的火焰燒熱了水壺里的水,導致水沸騰和蒸發。但蒸發的水不會導致火焰在爐灶上燃燒。

慢跑能使人們變得更健康嗎?良好的健康狀況會使人們去慢跑嗎?事實上,這兩種因果關系同時成立。

例如,學音樂的學生往往家境富裕,他們的父母可以通過聘請家教來提升孩子的SAT成績。在這種情況下,因果路徑是從財富到SAT家教再到更高的SAT分數。上音樂課并不能讓你在SAT考試中獲得高分。是家長有錢才讓孩子去上音樂課,同樣也是因為家長有錢,他們的孩子才在SAT考試中取得高分(通過家教這個渠道)。

若兩個變量相關,則意味著可能存在因果關系,因此需要進一步探究——但這往往只是分析的開始。有趣的是,當研究者試圖尋找音樂課和高認知能力之間的因果關系時,他們總是以失敗告終。[1]因此,如果一個年輕的小號手弄斷了手指并因此退出音樂課,并不必然導致其未來的SAT成績下滑。總而言之,盡管上音樂課和SAT成績具有相關性,但上音樂課似乎并不會促使SAT成績提升。

你能想到其他把相關關系和因果關系混淆的情況嗎?加入高中運動隊是否會讓你的人生更加成功(例如,在30歲時有更高的收入)?在15歲時吸煙是否會讓你以后更有可能對非法毒品上癮?這些是因果關系嗎?還是只是相關關系?

相關關系可分為三類:正相關關系、負相關關系和零相關。正相關關系意味著兩個變量傾向于朝著相同的方向變動。例如,調查表明,收入相對較高的人比收入相對較低的人更有可能已婚。在這種情況下,我們可以說收入和婚姻狀況這兩個變量呈正相關關系。負相關關系意味著兩個變量傾向于朝著相反的方向變動。例如,受教育程度高的人失業的可能性相對較低。在這種情況下,我們說受教育程度和失業這兩個變量呈負相關關系。當兩個變量沒有關聯時,我們稱其為零相關。你的朋友數量和你住在街道的哪一邊沒有關系。

相關關系不意味著因果關系的情況

我們不應貿然認定兩個變量之間的相關關系必然意味著某種特定的因果關系,這主要出于以下兩個原因:

(1)遺漏變量;

(2)反向因果關系。

遺漏變量是指那些研究中被忽略,但如果將其納入便能夠解釋兩個變量為何相關的因素。前面提到,紅色廣告元素的數量和商場的銷售額增長率正相關。但是,紅色廣告元素并不必然帶來商場的銷售額增長。是圣誕季的來臨促使商場使用更多紅色廣告元素,同時使其月度銷售額不斷增長。因此,圣誕季是一個遺漏變量,它解釋了為什么紅色廣告元素往往和銷售額增長出現在同一時間(見圖2.3)。

圖2.3 遺漏變量的一個例子

注:商場中紅色廣告元素的數量與銷售額增長呈正相關。也就是說,當廣告以紅色為主題時,商場銷售額的按月環比增速往往更快。但并不是紅色廣告元素的使用帶來商場收入的增長,而是圣誕季的來臨促使商場使用了更多紅色廣告元素,同時使商場的銷售額上升。圣誕季是一個遺漏變量,它解釋了紅色廣告元素與銷售額按月環比增長之間的正相關關系。

是否也存在一個遺漏變量,可以解釋為什么受教育程度和收入存在正相關?一個可能的因素是個人努力工作的意愿。或許那些特別努力的人在大學課堂上的表現就比其他學生更好?也許經常熬夜寫學期論文得以讓勤奮的學生在課業上取得好成績,而這也使得他們愿意繼續留校學習。同樣的因素也使得這些人的收入比其他人更高,因為他們往往工作到很晚,或者經常周末加班。是這種狂熱的努力使你收入更高(同時讓你從大學畢業而沒有輟學),還是說接受高等教育這件事本身使你收入更高?什么是因?什么是果?我們將在本章稍后解開這個謎團。

反向因果關系是困擾我們區分相關關系和因果關系的另一個問題。當我們混淆原因和結果的方向時,就會產生反向因果關系。例如,考慮到相對富裕的人往往也相對健康,一些社會科學家便得出結論:擁有更多財富會給人們帶來更好的健康狀況,因為有錢人可以負擔得起好的醫療服務。但是,這兩者也可能存在反向因果關系:更好的健康狀況也許能給人們帶來更多的財富。例如,和不太健康的人相比,健康的人可以更努力工作,可以延遲退休,并且醫療支出更少。事實證明這兩種因果關系都存在:更多的財富能夠帶來更好的健康狀況,更好的健康狀況也能夠帶來更多的財富。

在我們的教育回報分析中,是否也有反向因果關系在起作用?也就是說,30歲時更高的工資能否讓你在20多歲時接受更多的教育?我們可以從邏輯上排除這種可能性。除非你擁有時光機,否則你30歲時的工資不可能讓你在20多歲時接受更多的教育。所以,在教育回報的例子中,反向因果關系不太可能存在。但是,在很多其他分析中,如在財富和健康之間的關系上,反向因果關系是一個關鍵的考慮因素。

選擇與結果

先花后付?

昂貴的婚禮會導致離婚?還是有什么其他因素在起作用?

兩位經濟學家——安德魯·弗朗西斯—譚和雨果·米亞隆基于美國的調查數據計算了婚禮支出和離婚率之間的實證關系。[2]他們發現,在結婚典禮或者訂婚戒指上花費更多的夫妻,有更高的離婚率(在其他因素保持不變的情況下)。例如,在他們的樣本中,婚禮花費超過2萬美元的新婚女性,其每年離婚的可能性是婚禮花費在5 000美元到1萬美元之間的女性的3.5倍。

這是一個有趣的實證證據。這種相關關系是否證明保持長久婚姻的關鍵是舉行一個小型婚禮,甚或是干脆來一場私奔?在婚禮上支出較多真的會導致夫妻離婚嗎?或者是有什么遺漏變量在其中發揮作用?什么遺漏變量會促使人們舉辦一場豪華的婚禮,也會導致他們最終離婚?虛榮心?自尊心?物質主義?

或者昂貴的婚禮可能會給新婚夫婦帶來經濟壓力,而這些壓力可能會導致離婚。所以,可能存在一條從婚禮支出到離婚率的因果路徑。

事實上,這篇論文的作者沒有聲稱自己證明了昂貴的婚禮會導致離婚。他們明白,相關關系并不意味著必然有因果關系。考慮到這種復雜的例子,我們能否確定什么是相關關系,什么是真正的因果關系?經濟學家已經為識別因果關系開發了一整套豐富的工具,我們會在之后討論其中的一些工具。

實驗經濟學和自然實驗

確定因果關系的一種方法是進行實驗。實驗是一種調查變量之間因果關系的受控方法。雖然你可能不會在報紙上讀到太多關于經濟實驗的報道,但關于醫學實驗的頭條新聞卻很常見。例如,美國食品藥品監督管理局(FDA)要求在新疫苗獲批供公眾使用之前,制藥公司必須通過精心設計的實驗來證明這些疫苗的有效性。在我們撰寫本書時,數十種新冠疫苗正在經歷這一嚴格的測試過程。

為了進行實驗,研究人員通常需要找到目標人群,之后將其分為實驗組(測試組)和對照組。實驗組會被暴露于某種新奇體驗之下,例如給他們注射一種有效性和安全性尚待評估的新型疫苗。相比之下,對照組沒有得到任何不同尋常的對待。對照組可能接受安慰劑疫苗注射,比如注射沒有任何已知益處的生理鹽水。實驗參與人員會被隨機分配到實驗組或者對照組。隨機化是指以隨機方式而非人為選擇的方式將受試者分配到實驗組或對照組。實驗組和對照組被對待的方式在其他方面完全相同,只在某一特定維度故意存在差別。實驗的最終目的是確定這一差別所產生的影響。

如果想要知道一種備受期待的新疫苗是否有助于避免受試者感染新冠病毒,我們可以找1 000名受試者,隨機將其中500人歸入實驗組,這些人將接受新疫苗注射。另外500人則歸入對照組,接受安慰劑疫苗(生理鹽水)注射。然后對所有受試者進行隨訪,監測他們的新冠病毒感染率。這項實驗的目的是檢驗如下因果關系假說:注射真正的疫苗比注射生理鹽水更能預防新冠病毒感染。

現在,考慮一項經濟學實驗。假設我們想知道大學學歷能夠產生什么影響。我們可以找到1 000名負擔不起大學費用但又想上大學的高中生(如果免費的話),隨機選擇其中500人歸入實驗組,為他們支付所有上大學的費用。其他500名學生則被歸入對照組。然后我們會跟蹤所有1 000名學生,包括那500名因為負擔不起學費而未能上大學的學生。我們將對他們成年之后的生活進行定期調查,并觀察受過大學教育群體和沒受過大學教育群體的工資水平。這項實驗將檢驗大學教育會促使工資上漲這一假說。

實驗成本有時會非常昂貴。例如,我們剛剛所描述的大學入學實驗將耗資數千萬美元,因為研究人員需要為500名學生支付上大學的費用。

另一個問題是,實驗不能立即為一些重要的問題提供答案。例如,要想知道受更多教育對整個職業生涯工資水平的影響,需要耗費數十年的時間。

還有一個問題是實驗有時候運行不佳。例如,如果醫學研究人員沒有真正隨機分配病人接受治療,那么這個實驗可能根本沒有教給我們任何東西。再例如,如果去前沿研究型醫院的患者恰好是那些獲得新疫苗的患者,那么我們就無法確定因果關系;我們無法了解患者的病情好轉到底是因為疫苗還是因為這些重點醫療中心的其他什么東西。在一個精心設計的實驗中,誰接受新疫苗注射和誰不接受注射,完全是隨機決定的。

如果研究設計得很糟糕,經濟學家便對其結論持懷疑態度。糟糕的研究方法會導致無效的研究結論,這就是我們經常說的“廢料進,廢品出”。

如果我們沒有預算或時間來進行實驗,或者沒有能力進行真正的隨機化實驗,我們還能用什么方法來確定因果關系?一種方法是研究由自然實驗產生的歷史數據。自然實驗是一種實證研究,在這種研究中,一些不受實驗者控制的過程會以隨機或近乎隨機的方式將受試者分配到對照組和實驗組。

在很多情況下,自然實驗是我們唯一能從中得出結論的實驗方法。例如,將軍們不會隨機選擇村莊投擲炸彈——如果這樣做了,他們會被送上軍事法庭。但有時,隨機因素會導致一些村莊遭到轟炸,而其他村莊則得以幸免。梅麗莎·戴爾是一位經濟學家,她曾榮獲享有盛譽的貝茨·克拉克獎。為了確定越南戰爭期間不同轟炸政策的影響,她對一次這樣的自然實驗進行了探究。[3]大多數自然實驗在倫理方面遠沒有那么復雜。稍后,我們將討論一項自然實驗——在這個例子中,義務教育法的改變使得一些孩子多獲得了一年的教育。

經濟學家發現并利用自然實驗來回答許多重大問題。這種方法有助于為我們手頭的問題提供更明確的答案:你從教育中得到了什么?

循證經濟學

教育能帶來什么回報?

1個世紀之前,義務教育法的執行遠沒有現在這么嚴格,青少年高中未畢業便可以輟學。菲利普·奧雷普盧斯研究了義務教育法的變化所引發的一項自然實驗。[4]在1947年之前,英國允許孩子在年滿14歲時便可輟學。但在1947年,英國將允許輟學的年齡提高了1歲,即必須年滿15歲方可輟學。在1947年前,多數英國孩子都會在14歲輟學。但在1947年之后,幾乎再沒有人這么做。

在這項自然實驗中,這些在1946年年滿14歲的孩子就變成了在1948年年滿14歲孩子的“對照組”(后者被強制要求多上1年學)。奧雷普盧斯將1946年年滿14歲孩子的終生勞動力市場收入同1948年年滿14歲孩子的終生勞動力市場收入進行了對比。[5]利用這一自然實驗,奧雷普盧斯估算出多上1年學的回報大約為10%。換句話說,他的分析表明,多上1年學的因果效應是可以讓你在勞動生涯的每一年都多掙10%。

自然實驗是實證經濟學中一個非常有用的數據來源。在很多問題中,它們幫助我們把相關關系和因果關系區分開來。在教育回報這個問題上,自然實驗的結果證明受教育年限和高收入之間的相關性并不僅僅是因為存在某些遺漏變量,也體現了教育的因果影響。由此可見,教育回報模型得到了強有力的數據支持。每多接受1年教育會使你未來的收入提升10%,這個結論有沒有讓你想多上幾年學?

[1] Samuel A. Mehr, Adena Schachner, Rachel C. Katz, and Elizabeth S. Spelke, “Two Randomized Trials Provide No Consistent Evidence for Nonmusical Cognitive Benefits of Brief Preschool Music Enrichment,”PloS ONE 8(12): 2013, e82007. https://www.ncbi.nlm.nih.gov/pubmed/24349171

[2] Andrew Francis-Tan and Hugo M. Mialon,“‘A Diamond Is Forever’ and Other Fairy Tales: The Relationship between Wedding Expenses and Marriage Duration,” Economic Inquiry 53(4): 2015, 1919–1930. http://ssrn.com/abstract=2501480.

[3] Dell, Melissa, and Pablo Querubin. “Nation Building through Foreign Intervention:Evidence from Discontinuities in Military Strategies.” The Quarterly Journal of Economics 133(2): 2018, 701–764.

[4] Philip Oreopoulos, “Estimating Average and Local Treatment Effects of Education When Compulsory Schooling Laws Really Matter,” American Economic Review 96(1): 2006, 152–175.

[5] 分別在1946年和1948年年滿14歲的人,可能面臨不同的歷史背景,從而決定了其將來面臨不同的收入,這是一個遺漏變量。——審校注

主站蜘蛛池模板: 筠连县| 阳原县| 宽城| 安康市| 宁安市| 海宁市| 高陵县| 剑阁县| 民和| 集贤县| 郸城县| 崇阳县| 徐州市| 永兴县| 丹东市| 句容市| 虞城县| 通许县| 张家口市| 勃利县| 宜君县| 丽江市| 洪江市| 融水| 樟树市| 五莲县| 日土县| 南京市| 成都市| 永胜县| 乃东县| 北流市| 广昌县| 彰化县| 政和县| 灌阳县| 土默特左旗| 肥东县| 西乡县| 霍山县| 孟州市|