- 拆穿數(shù)據(jù)胡扯
- (美)卡爾·伯格斯特龍 杰文·韋斯特
- 3438字
- 2022-04-18 11:13:21
前言
當(dāng)今社會(huì)胡扯現(xiàn)象隨處可見,令人不勝其煩。政治家無視事實(shí)信口開河,科研人員把發(fā)新聞稿視為科學(xué)研究,硅谷的初創(chuàng)公司將胡扯發(fā)展到了藝術(shù)的高度,大學(xué)獎(jiǎng)勵(lì)的是胡扯而不是分析思維,大多數(shù)管理活動(dòng)似乎只不過是一個(gè)對胡扯進(jìn)行編排組合的復(fù)雜過程。心懷不軌的廣告商朝我們眨眨眼,誘導(dǎo)我們和他們一起把胡扯進(jìn)行到底,而我們也眨眨眼表示回應(yīng)——與此同時(shí),我們就會(huì)放松警惕,對他們奉送的修飾過的胡扯信以為真。胡扯在具體問題上誤導(dǎo)我們,破壞我們對一般信息的信任,因此會(huì)污染我們這個(gè)社會(huì)。盡管能力有限,但我們希望可以通過本書,對這一現(xiàn)象給予回?fù)簟?/p>
哲學(xué)家哈里·法蘭克福認(rèn)為,胡扯現(xiàn)象無處不在是我們這個(gè)時(shí)代的一個(gè)典型特征。他在他的大作《論胡扯》的開頭指出:
我們文化的一大特點(diǎn)就是胡扯太多。人人都知道,而且人人都有份,但我們往往會(huì)把這種情況視為理所當(dāng)然。(不過,)我們不清楚胡扯是什么,為什么如此之多,也不知道它有什么作用。我們沒有認(rèn)真探討胡扯的真正含義。換句話說,我們沒有形成理論。
要徹底消滅胡扯,就需要準(zhǔn)確地了解它是什么。這就有點(diǎn)兒棘手了。
首先,“胡扯”(bullshit)既是名詞也是動(dòng)詞。我不僅聽膩了你的胡扯(名詞),也可以反過來跟你胡扯(動(dòng)詞)。這很好懂。簡單地說,胡扯作為動(dòng)詞就是指說一些胡扯的話。
但是,“胡扯”這個(gè)名詞到底指的是什么呢?和許多人試圖用哲學(xué)概念匹配日常語言的努力一樣,試圖為它制定一個(gè)涇渭分明的定義的努力也必然徒勞無功。因此,我們將從例子著手,描述一些可以稱之為胡扯的東西。
大多數(shù)人都認(rèn)為自己擅長發(fā)現(xiàn)胡扯。當(dāng)胡扯以修辭或花哨的語言形式出現(xiàn)(我們稱之為老派胡扯)時(shí),他們這樣想也許沒有錯(cuò)。例如:
? 我們的共同使命是發(fā)揮雙方解決方案的作用,使未充分利用的人力資源組合機(jī)會(huì)得到充分利用。(換句話說,我們是短期工中介公司。)
? 我們存在的意義在于傳播。要開始這個(gè)神話,就要成為它的一部分。(我們可以把這稱為新時(shí)代的老派胡扯。)
? 我們像先輩一樣,懷著堅(jiān)定的思想和滿腔的熱忱,眼光掠過偉大祖國的無垠疆土,重新點(diǎn)燃我們共同命運(yùn)的火花。(算了吧,你還是說說如何讓我們這個(gè)地區(qū)重新得到更多的就業(yè)機(jī)會(huì)吧。)
老派胡扯似乎并沒有消失,但隨著新派胡扯的興起,它似乎沒有那么引人注目了。新派胡扯使用數(shù)學(xué)、科學(xué)和統(tǒng)計(jì)語言來制造嚴(yán)謹(jǐn)準(zhǔn)確的印象。它們利用數(shù)字、統(tǒng)計(jì)數(shù)據(jù)和數(shù)據(jù)圖表粉飾那些可疑的論斷,給它們披上了一層合理的外衣。新派胡扯可能會(huì)采用下面這些形式:
? 根據(jù)貨幣匯率加以調(diào)整后,我們表現(xiàn)最好的全球基金在過去9年中有7年跑贏了市場。
(回報(bào)率到底是如何調(diào)整的?該公司有多少基金未能跑贏市場,相差多少?就這個(gè)問題而言,是某一只基金在9年中有7年跑贏了市場,還是在這7年中每年都有一只不同的基金跑贏了市場?)
? 雖然沒有統(tǒng)計(jì)意義(p = 0.13),但我們?nèi)〉玫慕Y(jié)果突出表明了我們靶向治療腫瘤的臨床意義(5年生存率比為1.3),并對當(dāng)前的治療范式提出了挑戰(zhàn)。
(如果一個(gè)結(jié)果沒有統(tǒng)計(jì)意義,那么討論它的臨床意義又有什么意義呢?5年生存率是這種特定癌癥的相關(guān)指標(biāo),還是說大多數(shù)患者在3年內(nèi)死亡?為什么我們要認(rèn)為這“對當(dāng)前的治療范式提出了挑戰(zhàn)”?)
? 該團(tuán)隊(duì)的卷積神經(jīng)網(wǎng)絡(luò)算法可以從一個(gè)由人類代謝組、轉(zhuǎn)錄組和蛋白質(zhì)組構(gòu)成的多層網(wǎng)絡(luò)中提取底層控制邏輯。
(什么是多層網(wǎng)絡(luò)?這些不同的“組”之間的連接有什么重要意義?如何測量?作者所說的“控制邏輯”是什么意思?我們?nèi)绾沃肋@些系統(tǒng)真的是通過一個(gè)底層控制邏輯連接到一起的?我們?nèi)绾未_證這種方法可以提取這個(gè)底層控制邏輯呢?)
? 我們的系統(tǒng)篩查顯示,34%的有行為障礙的二年級學(xué)生承認(rèn)在過去一年里至少聞過一次神奇馬克筆。
(這個(gè)數(shù)據(jù)很重要嗎?如果真的很重要,那么聞馬克筆這個(gè)行為是“行為障礙”的原因還是結(jié)果?有多少?zèng)]有行為障礙的二年級學(xué)生承認(rèn)聞過馬克筆?也許這個(gè)比例更高!)
新派胡扯之所以特別有效,是因?yàn)槲覀冎械脑S多人覺得沒有資格質(zhì)疑以數(shù)量形式呈現(xiàn)的信息。這讓那些新派胡扯者們正中下懷。要反擊,就必須學(xué)會(huì)在合適的時(shí)機(jī),以合適的方式質(zhì)疑這些言論。
< ◇ >
在教學(xué)中,我們一直在教導(dǎo)學(xué)生如何對數(shù)據(jù)進(jìn)行邏輯和定量思考。本書源于我們在華盛頓大學(xué)教授的一門叫作“Calling Bullshit”的課程,目的是說明一個(gè)事實(shí):即使你不是一名專業(yè)的統(tǒng)計(jì)學(xué)家、計(jì)量經(jīng)濟(jì)學(xué)家或數(shù)據(jù)科學(xué)家,你也能批判性地思考那些定量論證;無須大量數(shù)據(jù)和數(shù)周時(shí)間,也能看穿胡扯。只要有基本的邏輯推理,在需要的時(shí)候,再輔以通過搜索引擎輕松獲取的信息,通常就足以解決問題了。
作為公民,我們肯定希望可以幫助人們發(fā)現(xiàn)并駁斥胡扯。這不是左翼或右翼意識(shí)形態(tài)的問題;這兩個(gè)陣營的成員都證明了自己善于制造和傳播錯(cuò)誤信息。相反(盡管有夸大其詞的危險(xiǎn)),我們認(rèn)為擁有足夠的辨別胡扯的能力對民主的存續(xù)來說至關(guān)重要。民主一直依賴于選民的批判性思維,但在當(dāng)今這個(gè)時(shí)代,社交媒體的傳播導(dǎo)致選舉過程深受假新聞和國際干預(yù)的影響,這同時(shí)也賦予了批判性思維前所未有的重要地位。在2016年12月的《紐約時(shí)報(bào)》專欄文章中,馬克·加萊奧蒂總結(jié)了應(yīng)對這種信息戰(zhàn)的最有效防御措施:
美國政府不應(yīng)該試圖直接打擊每一次泄密,而是應(yīng)該教育公眾,讓他們知道自己什么時(shí)候被操縱了。通過學(xué)校、非政府組織和公共服務(wù)活動(dòng),美國人應(yīng)該掌握成為精明的媒體消費(fèi)者所必需的基本技能,包括核實(shí)新聞的真實(shí)性、識(shí)別說謊圖片的能力。
本書兩名作者都是擁有數(shù)十年數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)和相關(guān)學(xué)科教學(xué)經(jīng)驗(yàn)的公立大學(xué)教師,對于如何教授這種思維并不陌生。我們認(rèn)為,批判性思維并不要求我們在政治上偏向某一方。你可能在多個(gè)問題上(例如聯(lián)邦政府的最佳規(guī)模,政府介入我們私人生活的可接受程度,或者國家在世界舞臺(tái)上應(yīng)該如何表現(xiàn)自己)與我們的觀點(diǎn)不一致,但沒有關(guān)系,我們只是想幫助持各種政治觀點(diǎn)的人當(dāng)面指斥胡扯。因?yàn)槲覀冋J(rèn)為,當(dāng)選民能夠看穿來自各個(gè)方面的胡扯時(shí),民主才是最健康的。
我們不是在建立一個(gè)平臺(tái),讓我們可以就不喜歡的事情胡扯。因此,本書中的例子很少是我們所知道的最惡劣的例子,更不可能是那些讓我們憤怒不已的例子。相反,我們選擇的例子都是為了達(dá)到教學(xué)目的,找出特定的陷阱,突出適當(dāng)?shù)膽?yīng)對策略。我們希望你通過閱讀和思考,學(xué)會(huì)當(dāng)面指斥胡扯。
< ◇ >
一個(gè)多世紀(jì)前,哲學(xué)家約翰·亞歷山大·史密斯在對牛津大學(xué)新生發(fā)表演講時(shí)說:
你在學(xué)校學(xué)到的東西對你(將來的生活)幾乎毫無用處,但它有一個(gè)好處:只要你認(rèn)真學(xué)習(xí),方法得當(dāng),那么在別人胡說八道的時(shí)候你會(huì)有所察覺。我認(rèn)為,這即使不是教育的唯一目的,也是它的一個(gè)主要目的。
盡管取得了一些成功,但我們認(rèn)為從這個(gè)角度看,高等學(xué)校STEM學(xué)科(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)的教學(xué)存在一些問題。一般而言,我們在操作方法教學(xué),也就是在引導(dǎo)學(xué)生學(xué)習(xí)如何操作矩陣、轉(zhuǎn)染細(xì)胞、運(yùn)行基因組掃描和運(yùn)用機(jī)器學(xué)習(xí)算法這些方面做得很好。但這種關(guān)注事實(shí)和技能的做法是以犧牲批判性思維藝術(shù)的訓(xùn)練和實(shí)踐為代價(jià)的。在人文和社會(huì)科學(xué)領(lǐng)域,學(xué)生們被教導(dǎo)要讓相互沖突的觀點(diǎn)相互碰撞,要與不一致的觀點(diǎn)做斗爭;但在STEM領(lǐng)域,學(xué)生們解決悖論、調(diào)和相互矛盾的證據(jù)、批判錯(cuò)誤論斷的機(jī)會(huì)非常少。因此,大學(xué)畢業(yè)生往往精于質(zhì)疑言語論證過程、識(shí)別邏輯謬誤,但令人驚訝的是,在面對通過數(shù)據(jù)提出的論斷時(shí)他們往往會(huì)默然接受。當(dāng)然,中學(xué)教育也是如此。現(xiàn)在的學(xué)生可以坦然拒絕政治、倫理、藝術(shù)和哲學(xué)論斷中的胡扯,但如果STEM教育采用在人文學(xué)科中已經(jīng)習(xí)以為常的質(zhì)詢式教學(xué)方式,培養(yǎng)出來的學(xué)生就能以同樣駕輕就熟的方式,拒絕統(tǒng)計(jì)報(bào)表和人工智能分析中的胡扯。
出于若干原因,我們在接下來的章節(jié)中大量引用了科學(xué)和醫(yī)學(xué)研究中的例子。我們熱愛科學(xué),這也是我們的專長所在。科學(xué)依賴于我們在這本書中提到的定量論證。在人類創(chuàng)立的所有體系中,科學(xué)似乎最不應(yīng)該受到胡扯的影響——但事實(shí)并非如此。我們認(rèn)為,公眾對科學(xué)的理解受到了諸多因素的妨礙,而理解正確與否,對于選民能否做出明智的決定具有至關(guān)重要的意義。本書的目的就是找出癥結(jié)所在。
但我們必須著重指出,我們絕不否認(rèn)科學(xué)是理解物理世界的一個(gè)成功的標(biāo)準(zhǔn)手段。不管我們抱怨什么,不管我們發(fā)現(xiàn)了什么偏見,不管我們遇到什么問題,不管我們說了什么廢話,科學(xué)最終還是會(huì)成功的。有了科學(xué)的支持,我們才能乘坐飛機(jī)環(huán)游世界,通過視頻電話交談,移植器官,根除傳染病,理解大爆炸后的早期階段、生命的分子基礎(chǔ)等現(xiàn)象。
新的信息技術(shù)已經(jīng)改變了我們的科學(xué)和社會(huì)交流方式。隨著信息獲取途徑得到改善,信息超載的現(xiàn)象愈演愈烈。我們希望本書能幫助你面對沖擊,將事實(shí)與虛構(gòu)區(qū)分開來。
- 巨大的鴻溝(重譯版)
- 華爾街風(fēng)云50年
- 供應(yīng)鏈與物流管理研究前沿報(bào)告 2015
- 元宇宙:新時(shí)代新商業(yè)新場景
- 國有企業(yè)高管薪酬管制與會(huì)計(jì)信息透明度的關(guān)系研究
- 2018年經(jīng)濟(jì)與貿(mào)易評論(第15輯)
- 人機(jī)平臺(tái):商業(yè)未來行動(dòng)路線圖
- 無價(jià)(新版)
- 重塑商業(yè):5G時(shí)代創(chuàng)新組織系統(tǒng)
- 元宇宙是什么
- 格格不入:奧默羅德的經(jīng)濟(jì)學(xué)思維
- 安全、發(fā)展與治理:中國企業(yè)海外投資風(fēng)險(xiǎn)及其管控
- 氣候變化與保險(xiǎn)
- NFT:價(jià)值驅(qū)動(dòng)未來
- 數(shù)字貨幣來了:比特幣·區(qū)塊鏈·貨幣未來