- 拆穿數據胡扯
- (美)卡爾·伯格斯特龍 杰文·韋斯特
- 1768字
- 2022-04-18 11:13:21
推薦序2
撥開胡扯的迷霧
姚利芬 中國科普研究所創作研究室副研究員
哲學家哈里·法蘭克福在其著作《論胡扯》中稱:在我們的文化里,有太多的人在“胡扯” (bullshit)。在某種意義上,“胡扯”比“說謊”對我們的危害性更大。說謊的人知道何者為真,講的卻是假話。胡扯的人既不關心何者為真,也不關心何者為假,只在乎自身利益。然而,什么是胡扯?胡扯的存在形式是什么?如何發現胡扯?這些問題一直困擾著我們。這些問題猶如問我們什么是時間一樣,“如果沒有人問我,我是明白的;如果我想給問我的人解釋,那我就不明白了”。
幸運的是,這本書對此給出了試探性的回答。
很多人認為自己很容易發現胡扯,因為胡扯常以花哨的語言形式出現。然而,本書重點并非研究這種老派胡扯,而是研究新派胡扯。新派胡扯試圖用數學和統計語言來營造嚴謹性、準確性,試圖給胡扯披上“科學”的外衣。為什么新派胡扯總是利用數字、統計數據和數據圖表粉飾那些可疑的論斷,給它們披上了一層合理的外衣呢?本書作者沒有對此進行研究。在我看來,這是近代以來對自然的數學化造成的。自然的數學化的本質并非是使用數學的語言描繪大自然和人類社會,而是把整個世界看成是使用數學的。在西方,這種傳統由來已久,起源于畢達哥拉斯–柏拉圖傳統,他們認為數學或者理念是世界的本質。在近代,伽利略宣稱大自然這本書是用數學寫成的。因此,哪個學科越能用數學的語言進行描述,哪個學科就越“科學”,也就越不容置疑。這就解釋了本書作者發現的一個現象:“在人文和社會科學領域,學生們被教導要讓相互沖突的觀點相互碰撞,要與不一致的觀點做斗爭;但在STEM領域,學生們解決悖論、調和相互矛盾的證據、批判錯誤論斷的機會非常少。”無論如何,新派胡扯不那么容易被人發現,我們經常被種種數學化的形式所“忽悠”。不過,閱讀此書會幫助我們快速而準確地辨別出這些新派胡扯。
這本書邏輯清晰、語言優美,很多地方論述得十分精彩。印象最深的是第4章,即因果關系,這也是揭示新派胡扯十分關鍵的一步。雖然書中沒有明確提出,但我認為作者是通過以下幾個方面論述因果關系中的胡扯的。
首先,把相關性當成因果關系。毫無疑問,因果關系是某種關聯,但并非有關聯的兩個事物都存在因果關系。暴風雪來臨之前,氣壓計讀數會產生變化,但我們不認為氣壓計的讀數的變化導致了暴風雪的來臨。雖然兩者看似有先行后續的聯系,但這種聯系并非因果關系。其實,氣壓的變化導致了氣壓計讀數的變化,也導致暴風雪的來臨。也就是說,暴風雪和氣壓計讀數的變化有一個共同原因,它們之間卻沒有因果關系。新派胡扯經常把聯系說成存在因果關系,以達到胡扯者的其他目的。在作者看來,雖然結婚率與自殺率有關,但這并不意味著婚姻會導致自殺。因此,我們不要看到數據顯示相關性,就草率地認為存在因果關系。
其次,因果倒置。我們通常用旗桿的長度解釋旗桿的影長,這是因為旗桿是產生旗桿影長的原因。反之,那簡直就是胡扯。本書中也提到了這種因果倒置的胡扯形式。偉大的統計學家之一羅納德·費希爾試圖證明,吸煙不會導致肺癌,而是肺癌導致吸煙。他的理由是,肺癌導致患者不適,而吸煙可以緩解這種不適。
再次,憑借錯誤的假設推導出因果關系。本書中給我們提供了如下例子。據心理學家斯科特·蓋勒和同事研究,買扎啤的學生喝的啤酒數量大約是買杯裝和瓶裝啤酒的學生的2~4倍。但是,隨著時間推移,這一論斷也發生了變化。“如果喝扎啤,就會喝得更多”被理解為“人們喝得更多是因為他們喝的是扎啤”。因此,“我們應該禁售扎啤,這樣學生們就會少喝酒”。毫無疑問,這也是一種胡扯。
最后,在一些偽相關性中尋找因果關系。作者說,有的關聯性無關緊要,甚至不值一提,在這些關聯性中尋找因果關系簡直是一種胡扯。例如,在美國小姐的年齡與被水蒸氣、熱蒸氣等高溫物體謀殺的人數關聯中尋找因果關系,簡直就是不折不扣的胡扯。
如何解決涉及因果關系的胡扯呢?作者給出的方法是人為操控。雖然作者沒有明確指出,但從這里也可以看出作者想利用因果關系的操控理論來解決此問題。因果關系的操控理論種類繁多,不過哲學家詹姆斯·伍德沃德提出的理論能被大多數人所接受。雖然新派胡扯總是利用數字、統計數據和數據圖表等形式,但本書沒有或許會讓讀者眼花繚亂的方程式,通篇充溢著幽默感,讀起來輕松愉悅。在這種閱讀氣氛中,讀者不知不覺學會了如何發現和拆穿胡扯、駁斥謊言的策略。