官术网_书友最值得收藏!

引言
一個近乎“萬物理論”的理論


精神病學(xué)領(lǐng)域有一條通用準(zhǔn)則:如果你認(rèn)為自己找到了可以解釋萬物的終極理論,那你應(yīng)該是患上了妄想癥,快去醫(yī)院看看吧。[1]

——斯科特·亞歷山大


我們能預(yù)測未來嗎?當(dāng)然可以!

可以肯定的是,接下來的幾秒鐘內(nèi)你必然會吸進(jìn)一口氣,再把它呼出去。你還可以自信地預(yù)測,你的心臟會繼續(xù)跳動,每秒一到三下;明早太陽會照常升起,盡管具體時刻取決于你所處的緯度和時節(jié),但精準(zhǔn)的數(shù)據(jù)并不難找。

你還可以預(yù)測火車到站的時間,預(yù)測你的朋友會準(zhǔn)時抵達(dá)事先說好的飯店,盡管你在做出這些預(yù)測時的自信程度會受到具體是哪家鐵路公司、哪位朋友的影響。

此外,你還可以預(yù)測,世界人口將持續(xù)增長至21世紀(jì)中葉,然后開始下降;2030年的全球平均地表溫度將高于1930年。

未來并非無法窺測,我們有能力撥開迷霧一探究竟。有些東西很好預(yù)測,比如根據(jù)傳統(tǒng)力學(xué)預(yù)測幾千年之內(nèi)的行星軌跡;有些東西則很難預(yù)測,比如在混沌理論的背景下預(yù)測天氣——能預(yù)測幾天就很了不起了。但不管怎么說,我們總能掀開帷幔,或多或少地看到一些未來。

大眾口中的“預(yù)測未來”通常指的是一些極為神秘的、涉及超自然力量的、神一般的預(yù)言。但本書提到的“預(yù)測未來”并不是這個意思,我們很難有這種通天之術(shù)(后文會提到一位科學(xué)家,他認(rèn)為我們的確有這種能力,讀完之后你就會明白,他肯定是錯的)。事實(shí)上,我們根本不需要那種夸張的能力就能做出預(yù)測。我們這一生從來就沒有停止過對未來的預(yù)測,預(yù)測和生命是密不可分的。有些預(yù)測是很基本的,比如每次吸氣時,我們都會下意識地預(yù)測“空氣一直是可吸入的”。有些預(yù)測是較為復(fù)雜的,比如“街角的商店里會有歐倍牌麥片,我走進(jìn)去就能買到”,每個決策都伴隨著類似的預(yù)測。我們做出這些預(yù)測并非基于超能力,而是基于我們的經(jīng)驗(yàn)。

所有預(yù)測都存在一個問題,即結(jié)果的不確定性。我們不清楚這個世界到底是建立在決定論之上的,還是建立在非決定論之上的。倘若我們可以像全知全能的上帝一樣,知曉宇宙中每個粒子的位置、動量、性質(zhì),那我們或許就能完美地預(yù)測世間萬物,比如每只麻雀的死亡[2]。可惜我們并非全知全能,我們能夠掌握的信息很有限[3]。我們沒有完美的感知能力,所以我們無法看到宇宙的每個細(xì)節(jié),但我們可以利用有限的信息做出不完美的預(yù)測,比如我們可以大體預(yù)測出不同事物的活動方式:像人一樣的事物會傾向于尋找食物、組建團(tuán)隊(duì),像巖石一樣的事物往往只能靜止不動。

生命不是一局國際象棋,而是一場撲克游戲,因?yàn)榍罢叩男畔⑹峭耆模碚撋衔覀兛梢浴皯?yīng)對”任何狀況;而后者的信息是有限的,我們只能盡量根據(jù)掌握的信息做出最佳決策。

本書的主要內(nèi)容就是幫你學(xué)會做出最佳決策的“公式”。


《時間簡史》出版之后,史蒂芬·霍金曾說過這樣一句話:“有人對我說,書里每多出一個公式,它的銷量就會減少一半。”[4]可我這本書的核心內(nèi)容就是一個公式,想要一個公式都沒有也太困難了。[5]

這個公式就是著名的貝葉斯定理,它是一個極為簡潔的等式:

說來實(shí)在慚愧,其實(shí)我也討厭看到數(shù)學(xué)公式。雖然硬要我去使用公式的話,我也不是做不到,但我實(shí)在感到乏味無趣。可你知道嗎,最尷尬的是,雖然我已經(jīng)寫了3本書,且每本書都和數(shù)學(xué)密切相關(guān),但在看到Σ這個符號的時候,我的大腦仍會頻頻宕機(jī)。我想大多數(shù)讀者都和我有著類似的感受,這或許就是出版社警告霍金盡量不要在書中列出公式的原因。

不過我們也沒必要談公式色變,公式并不是什么晦澀難懂的咒語或密碼,它只是一種簡便的書寫方式,每個小符號都代表一個簡單的步驟(我常常這樣安慰自己)。

貝葉斯定理也是如此,它只是一個概率公式,它可以根據(jù)已知信息算出某件事發(fā)生的概率。具體來說,它是一種條件概率。公式中的豎線“|”是“在此情況下”或“以此為前提條件”的簡寫,PA |B)則指的是“在事件B已經(jīng)發(fā)生的情況下,事件A發(fā)生的概率”。

這里我們給出一個條件概率的簡例。你手中有一副去掉大小王的撲克牌,你想知道從中抽到紅桃的概率。已知撲克牌一共有52張,紅桃有13張,我們可以據(jù)此算出其概率——記作P(?)——等于13/52,或1/4,用數(shù)學(xué)語言表示就是p=0.25。然后我們假定你抽了一張牌,是梅花,那么此時抽到紅桃的概率是多少呢?我們知道牌堆中仍然有13張紅桃,但牌的總數(shù)變成了51,所以此時概率變成了13/51,或者說p≈0.255。這就是你已經(jīng)抽出一張梅花的情況下,再抽到一張紅桃的概率,即P(?| ?)。

再舉一例:倫敦某天下雨的概率是多少?答案是0.4左右,因?yàn)閭惗孛磕甏蠹s有150天在下雨。現(xiàn)在你往窗外瞥了一眼,發(fā)現(xiàn)烏云密布,那么此時下雨的概率是多少?我也不知道確切答案,但我知道,陰天下雨的概率肯定更高。

貝葉斯定理其實(shí)也是這個意思,只不過它的適用場景更為廣泛。用通俗的語言來解釋公式的四個部分,就是這個樣子:(事件B已經(jīng)發(fā)生的情況下,事件A發(fā)生的概率)=(事件A已經(jīng)發(fā)生的情況下,事件B發(fā)生的概率)×(事件A單獨(dú)發(fā)生的概率)÷(事件B單獨(dú)發(fā)生的概率)。

現(xiàn)在假設(shè)我們的社會出現(xiàn)了一種大規(guī)模傳播的疾病(可以參考剛剛經(jīng)歷的新冠疫情)。

為了弄清自己到底有沒有染上這種病,你做了一個測試。測試的指導(dǎo)手冊上寫著這樣一句話:“本測試的靈敏度和特異度均為99%。”也就是說,如果你真的染上了這種病,那么這個測試有99%的概率可以準(zhǔn)確地告訴你,你確實(shí)染上了這種病;如果你沒有染上這種病,那么它也有99%的概率可以準(zhǔn)確地告訴你,你沒有染上這種病。另外我們還可以這樣理解:該測試的“假陰性率”和“假陽性率”都是1%。

現(xiàn)在假定你的試紙上出現(xiàn)了兩條紅線,也就是說測試結(jié)果呈陽性。這意味著什么呢?你可能會自然而然地認(rèn)為,自己有99%的概率被傳染了。

但貝葉斯定理會告訴我們,事實(shí)并非如此。

貝葉斯定理是一個非常奇怪的定理。它的表達(dá)式十分簡潔,寫出來不占什么篇幅,涉及的運(yùn)算只有乘法和除法,就連8歲小孩都會算。它的提出者也只是一個生活在18世紀(jì)的普通富紳,這位富紳白天會在坦布里奇韋爾斯擔(dān)任牧師,但他并不信奉英格蘭國教[6],研究數(shù)學(xué)也只是業(yè)余愛好。盡管如此,貝葉斯定理仍舊產(chǎn)生了極為深遠(yuǎn)的影響——它可以解釋為什么即便癌癥測試呈陽性的人中有99%都沒有癌癥,測試的準(zhǔn)確率仍然可以高達(dá)99%;為什么DNA(脫氧核糖核酸)鑒定只有兩千萬分之一的概率匹配錯,但它仍有很大概率導(dǎo)致冤假錯案;為什么一個科學(xué)結(jié)論明明具有“統(tǒng)計(jì)顯著性”,但它仍舊有很大概率是錯的。

貝葉斯定理還涉及迷人的哲學(xué)思辨。“概率”是真實(shí)存在的嗎?我們說擲色子有六分之一的概率擲出1,這到底是什么意思?它是宇宙中確切存在的事實(shí),還是我們對這個世界所持有的一種信念?一次性事件也有概率嗎?如果我告訴你,曼城隊(duì)有90%的概率成為2025年的英超冠軍,那這到底意味著什么呢?

每次我們面對不確定的事物做出決策時—— 一直以來我們都是這樣做的——都可以利用貝葉斯定理來判斷該決策在多大程度上算是個好決策。事實(shí)上,無論是怎樣的決策過程,無論你為了實(shí)現(xiàn)某個目標(biāo)對世界產(chǎn)生了多大的影響,無論你掌握的信息多么有限,無論你是正在尋找高濃度葡萄糖環(huán)境的細(xì)菌,是正在利用復(fù)制行為傳播遺傳信息的基因,還是正在努力實(shí)現(xiàn)經(jīng)濟(jì)增長的政府,只要你想把事情干好,你就離不開貝葉斯定理。

AI(人工智能)本質(zhì)上也是貝葉斯定理的一個具體應(yīng)用。從最基本的層面來說,AI所做的事情就是“預(yù)測”。一個可以分辨貓狗圖像的AI應(yīng)用,本質(zhì)上就是在根據(jù)過往的訓(xùn)練數(shù)據(jù)和當(dāng)前的圖像信息去“預(yù)測”人類對圖片的判斷。DALL-E 2、GPT-4、Midjourney等各種優(yōu)秀的AI應(yīng)用,正在以令人應(yīng)接不暇的速度一次次沖擊人們的認(rèn)知,我寫下這段話的時候可能就剛好有一個震撼世界的AI應(yīng)用橫空出世。不過,這些和你談笑風(fēng)生、為你生成高質(zhì)量圖像的AI,本質(zhì)上也是在做預(yù)測,只不過它們預(yù)測的是人類作家、人類藝術(shù)家面對這些提示詞時會如何作答。這些預(yù)測行為的基礎(chǔ)都是貝葉斯定理。

大腦的工作也離不開貝葉斯定理,這就是人類容易產(chǎn)生視錯覺、致幻劑可以致幻的原因,同時也是思想意識的工作原理。

貝葉斯定理可以讓我們明白,為什么陰謀論的觀點(diǎn)難以轉(zhuǎn)變;為什么兩個人可以根據(jù)同樣的證據(jù)得出完全相反的結(jié)論。比如,為什么那些科學(xué)事實(shí)能夠讓我相信疫苗安全有效,卻無法說服一個懷疑論者呢?答案就是,根據(jù)貝葉斯定理,一個人對新信息的判斷會受到既有認(rèn)知的影響。這并不是說那些懷疑疫苗的人、那些陰謀論者是大腦運(yùn)轉(zhuǎn)方式與眾不同的外星人,而是說他們也是完全理性的人,只不過他們的行為建立在固有思想之上。貝葉斯定理可以很好地解釋這一點(diǎn)。

由此可見,雖然貝葉斯定理不是萬物理論,但實(shí)際上也差不多了。一旦你開始站在貝葉斯定理的視角去看待問題,你就會發(fā)現(xiàn)貝葉斯定理真的是無處不在。我寫這本書的目的就是幫你做到這一點(diǎn)。


通常人們會用醫(yī)療檢測來解釋貝葉斯定理,本書也不例外。這里我們給出一些比較可靠的數(shù)據(jù):假定你正準(zhǔn)備進(jìn)行乳腺癌的篩查檢測,且已經(jīng)知道,如果某位女性的確患有癌癥,那么乳房X光在80%的情況下可以正確識別出癌癥(靈敏度為80%),在另外20%的情況下會發(fā)生漏診,即假陰性;如果某位女性沒有癌癥,那么乳房X光在90%的情況下可以正確排除癌癥(特異度為90%),在另外10%的情況下會發(fā)生誤診,即假陽性。

假定你的檢測結(jié)果呈陽性,那是不是說明,你有90%的概率患上了乳腺癌?不是的。事實(shí)是,根據(jù)上面給定的這些信息,你根本無法判斷自己患上乳腺癌的概率到底有多大。

你還需要額外掌握一個信息,那就是在參加檢測之前,你對自己患上乳腺癌的概率的預(yù)估。最簡單的預(yù)估方式就是找出特定時期內(nèi),與你同齡的女性中的乳腺癌患者的比例。我們假定這一比例為1%。

為了讓案例更加具體,我們進(jìn)一步假定共有10萬名女性參加了檢測,那么按照1%的患病比例來看,這些人中一共有1000名乳腺癌患者。在這1000名患者當(dāng)中,乳房X光只能正確檢測出800名,另外200名將會出現(xiàn)漏診;剩下的99000人沒有患乳腺癌,在這些健康人當(dāng)中,乳房X光只能正確判斷出89100人,這意味著會有99000-89100=9900人被誤診為乳腺癌。下面我們把數(shù)據(jù)整理成表格:

現(xiàn)在你明白了吧,得到陽性結(jié)果的女性一共有10700名,其中只有800人真的患有乳腺癌。換句話說,假定你的檢測結(jié)果呈陽性,那么你真正患有乳腺癌的概率是800/10700≈0.07,即7%。

具體結(jié)果完全取決于檢測前人群中患有乳腺癌者的比例。假如檢測對象是高風(fēng)險人群,比如具有家族癌癥史的老年婦女,那么這一比例可能高達(dá)10%,此時計(jì)算結(jié)果會發(fā)生翻天覆地的變化。

現(xiàn)在真陽性的人數(shù)從800漲到了8000,假陽性的人數(shù)下降至9000。此時一個拿到陽性結(jié)果的人真正患乳腺癌的概率變成了8000/17000,結(jié)果約為47%。知道這一點(diǎn)后,拿到陽性結(jié)果的人會比剛才更加憂慮。整個檢測方法沒有任何變化,發(fā)生變化的只有先驗(yàn)概率。

換句話說,貝葉斯定理可以告訴你結(jié)果的可靠程度。可是要做到這一點(diǎn),你必須對這件事有一個先驗(yàn)預(yù)估。

現(xiàn)在我們再來看看這個公式(本書的銷量該不會又減半了吧……畢竟這個公式剛才已經(jīng)出現(xiàn)過一次)。

經(jīng)過一系列計(jì)算之后,我們得到的結(jié)果就是PA|B),即事件B已經(jīng)發(fā)生的情況下,事件A發(fā)生的概率。癌癥檢測與之類似,我們想知道的是,在檢測結(jié)果呈陽性的情況下,該患者真正患癌的概率。

可是“靈敏度80%”并沒有給出PA|B),反而給出了與之相反的P(B|A),即事件A已經(jīng)發(fā)生的情況下,事件B發(fā)生的概率。也就是說,它可以告訴我們,一個真正患有乳腺癌的人,有多大概率取得陽性結(jié)果。

乍一看好像沒什么不同,實(shí)際上這兩者的區(qū)別就像“某個人剛好是教皇的概率僅有八十億分之一”和“教皇剛好是個人類的概率僅有八十億分之一”的區(qū)別一樣大。[7]

為了得到想要的數(shù)據(jù),我們需要更多信息。在癌癥檢測的例子中,我們需要的額外信息是乳腺癌患者在人群中的比例。在醫(yī)學(xué)中,我們將其稱為發(fā)病率,或背景發(fā)生率;在貝葉斯定理中,這種額外信息一般被稱為先驗(yàn)概率。

醫(yī)學(xué)中的先驗(yàn)概率比較容易獲得,也很容易定義。比如你想知道某人患上亨廷頓病的風(fēng)險,那你可以去查詢?nèi)圃\所的診療記錄[8],然后據(jù)此算出平均每10萬人當(dāng)中約有12.3人患有該疾病。

其他情況則要復(fù)雜得多。如果幾年前你想計(jì)算俄烏爆發(fā)沖突的概率,那這個先驗(yàn)概率該怎么算?先算一下俄烏每年爆發(fā)沖突的頻次?還是先統(tǒng)計(jì)一下所有沖突爆發(fā)的頻次?或是先調(diào)查一下,看看兩國邊境突然增派大量坦克的時候,雙方爆發(fā)沖突的概率?

再舉一例。假定我提出了一個科學(xué)假說,做了一次相關(guān)實(shí)驗(yàn),且取得了不錯的數(shù)據(jù),此時該假說是一個正確假說的概率有多高?我們進(jìn)一步假定,如果該假說是錯誤的,那每20次實(shí)驗(yàn)中只有1次能取得這種數(shù)據(jù)。這是不是意味著,我的假說大概率是正確的?不是這樣的,因?yàn)樗€和另一個概率有關(guān)——我開始做實(shí)驗(yàn)之前,該假說為真的概率,即先驗(yàn)概率。可我該上哪兒去搞到這個數(shù)據(jù)呢?

法庭辯護(hù)中也有一個經(jīng)典案例。在已經(jīng)取得某些法庭證據(jù)的情況下,該嫌疑人有罪的概率是多少?假定嫌疑人的DNA恰好出現(xiàn)在現(xiàn)場的概率只有百萬分之一,那是不是說明警察只有百萬分之一的概率抓錯了嫌疑人?不是這樣的,因?yàn)檫@還取決于一開始警察就抓到了正確嫌疑人的概率有多大。可問題是,這項(xiàng)數(shù)據(jù)上哪兒去找呢?

放心,這些問題本書都會一一作答(有很多數(shù)學(xué)家研究過相關(guān)問題)。需要牢記的是,必須先得到一個先驗(yàn)概率,我們才能進(jìn)一步應(yīng)用貝葉斯定理。缺失了先驗(yàn)概率,我們只能得到一些不靠譜的結(jié)論。

大多數(shù)人第一次聽說貝葉斯定理都是在醫(yī)學(xué)領(lǐng)域,所以我們的旅程也從醫(yī)學(xué)領(lǐng)域開始。


這么多年來,我逐漸愛上了貝葉斯定理。第一次聽說貝葉斯定理,是在本·戈?duì)栠_(dá)克瑞于21世紀(jì)初在《衛(wèi)報(bào)》上開設(shè)的《小心壞科學(xué)!》專欄當(dāng)中。自那時起,我就對貝葉斯定理越來越著迷。包括本書在內(nèi),我已經(jīng)出版了3部作品,其中每本書都或多或少地提到了貝葉斯定理。該定理常常能夠得出一些反直覺的結(jié)論,令人連連稱奇。比如,某項(xiàng)測試的準(zhǔn)確率為99%,并不意味著該測試在99%的情況下是正確的。這到底是什么鬼話?雖然只要按部就班地推導(dǎo),就能逐漸理解這一事實(shí),但類似的結(jié)論總是能夠讓人感到不可思議,刷新認(rèn)知(至少我的感受是這樣的)。

過去4年當(dāng)中,也就是2020年年初全球暴發(fā)新冠疫情之后,貝葉斯定理推導(dǎo)出的那些結(jié)論變得越來越重要了。早在2020年4月,大部分人還處于居家隔離狀態(tài)的時候,英國前首相托尼·布萊爾等人就呼吁政府向那些已經(jīng)感染過新冠病毒、體內(nèi)已有抗體的人發(fā)放免疫證明,允許他們外出活動(當(dāng)然這發(fā)生在人們意識到各種變異病毒會導(dǎo)致患者很容易復(fù)陽之前)。

抗體測試問世沒多久,美國政府就緊急批準(zhǔn)了一種抗體檢測方法,該方法的靈敏度和特異度大約都是95%。[9]

聽上去挺靠譜。事實(shí)上,2020年4月,英國大約有3%的人口感染了新冠病毒,這一比例就是所謂的先驗(yàn)概率。如果有100萬人參加檢測,那么其中大約會有3萬人是新冠病毒感染者。在這3萬名患者當(dāng)中,會有28500人的檢測結(jié)果呈陽性;剩下的97萬健康人當(dāng)中,則會有48500人的檢測結(jié)果被錯誤標(biāo)記為陽性。

由此可見,在全部77000個陽性結(jié)果當(dāng)中,只有三分之一多一點(diǎn)的檢測者的確感染了新冠病毒(這就是后驗(yàn)概率)。英國人口一共有6800萬,假如政府真的讓所有人都參加了這項(xiàng)檢測,并向那些結(jié)果呈陽性的人發(fā)放免疫證明,就會導(dǎo)致約300萬根本沒有感染過新冠病毒的人可以自由地走街串巷,甚至去擁抱免疫力低下的爺爺奶奶,而事實(shí)上這些人根本不安全。不弄懂貝葉斯定理的話,你就沒法搞清楚這件事。

當(dāng)時英國有一群所謂的“權(quán)威人士”對居家隔離政策持懷疑態(tài)度,其中有一部分人已經(jīng)察覺到檢測數(shù)據(jù)有些不對勁,從而引發(fā)了一場和貝葉斯定理相關(guān)的巨大爭論。這些人當(dāng)中最著名的應(yīng)該就是威爾士地方政府前首席大臣約翰·雷德伍德,他認(rèn)為那些錯誤的檢測結(jié)果會歪曲新冠疫情的真相,并強(qiáng)烈要求政府顧問盡快給出一個制止這種現(xiàn)象的方案。[10]

這些懷疑論者之所以會覺得檢測數(shù)據(jù)不對勁,是因?yàn)樗麄冋`解了統(tǒng)計(jì)學(xué)教授戴維·斯皮格霍爾特爵士在一個訪談節(jié)目中的言論。戴維·斯皮格霍爾特經(jīng)常積極地在各種電視節(jié)目和廣播頻道中向公眾耐心解釋什么是檢測的準(zhǔn)確度,什么是疫苗的有效性。大家已經(jīng)明白,檢測的假陽性率為1%,并不意味著只有1%的陽性結(jié)果是誤診。當(dāng)時社會正處于第一波疫情和第二波疫情之間的緩沖期,此時人們只要一打噴嚏就得做PCR(聚合酶鏈?zhǔn)椒磻?yīng))檢測。從數(shù)據(jù)上來看,當(dāng)時英國的新冠病毒感染者非常少,隔離政策似乎的確降低了感染率,可整體上來看,感染率似乎又有一種上升趨勢。

那些持懷疑論的“權(quán)威人士”認(rèn)為,感染率上升只是一種假象,貝葉斯定理可以解釋個中玄機(jī)。具體來說,當(dāng)時有0.1%的人感染了新冠病毒。如果我們隨機(jī)對人群進(jìn)行檢測,且該檢測方式可以在99%的情況下正確識別出那些沒有感染新冠病毒的健康人,在90%的情況下正確識別出那些的確感染了新冠病毒的患者,那么最終將有超過90%的人得到假陽性結(jié)果。[11]

這個結(jié)論的確沒錯,問題在于他們對貝葉斯定理的理解不夠深刻。首先,先驗(yàn)概率真的是0.1%嗎?這一概率成立的前提是,參與檢測的人員都是從整個人口當(dāng)中隨機(jī)挑選出來的,但事實(shí)并非如此:參與檢測的要么是已經(jīng)表現(xiàn)出一定癥狀的人,要么是接觸過確診病例的人,這些人感染新冠病毒的概率要比其他人高得多。雖然我們不知道具體高多少,但我們知道,即便先驗(yàn)概率只有1%,假陽性的比例也會大幅下降至50%;如果先驗(yàn)概率為10%,那么大約有90%的陽性結(jié)果是真陽性。

那么,我們假定假陽性率為1%,會不會有點(diǎn)太夸張了呢?事實(shí)上,2020年夏天新冠疫情開始減弱的時候,檢測結(jié)果呈陽性的比例只有0.05%,其中包括了真陽性和假陽性,所以假陽性率不可能比這一數(shù)值還高。如此一來,在新冠病毒感染率為0.1%的前提下,假陽性率將下降至35%。感染率越高,假陽性率就越低。

其實(shí)不僅僅是新冠疫情,幾乎任何形式的醫(yī)學(xué)檢測都會涉及貝葉斯定理。

英國的國家醫(yī)療服務(wù)體系(NHS)提供3種常規(guī)的癌癥篩查,即乳腺癌、宮頸癌、結(jié)腸癌。雖然前列腺檢查不在常規(guī)檢查之內(nèi),但50歲以上的男性如果有需求,也可以把這項(xiàng)檢查加進(jìn)去。

為什么前列腺檢查沒有加進(jìn)常規(guī)的癌癥篩查呢?畢竟癌癥篩查聽上去就是件有益無害的事,越早發(fā)現(xiàn)越容易治療嘛。難道前列腺檢查有什么壞處嗎?

就像本書中的其他問題一樣,貝葉斯定理可以給出答案。

前列腺癌的篩查是通過PSA(前列腺特異性抗原)檢測來進(jìn)行的。醫(yī)護(hù)人員會檢驗(yàn)測試者的血液,如果血液中的PSA指數(shù)過高——正常值是3~4納克每毫升——測試者就有必要接受進(jìn)一步的檢查,比如掃描或活檢。需要注意的是,PSA過高既有可能是前列腺癌的信號,也有可能是感染、炎癥的征兆,還有可能是年邁導(dǎo)致的自然現(xiàn)象。

PSA檢測沒有前面提到的那些檢測方法那么精準(zhǔn)。根據(jù)英國醫(yī)療咨詢機(jī)構(gòu)——國家衛(wèi)生與臨床優(yōu)化研究所(NICE)提供的數(shù)據(jù)[12],如果以3納克每毫升的標(biāo)準(zhǔn)對患者進(jìn)行PSA檢測,那么該檢測將成功識別出32%的患者(靈敏度),以及85%的健康人(特異度)。

另外我們知道,50歲以上的男性患者中,大約有2%患有前列腺癌。[13]假如參加PSA檢測的人數(shù)共計(jì)為100萬,那其中大約會有2萬人確實(shí)患有前列腺癌。可是這項(xiàng)檢測只能正確識別其中的6400名患者。剩下的98萬健康人當(dāng)中,將有147000人需要進(jìn)行額外的后續(xù)檢查。如果一名50多歲的男性在該檢測中得到了陽性結(jié)果,那他實(shí)際上只有4%的概率真正患有前列腺癌。

4%的概率需要我們認(rèn)真對待嗎?或許吧,但可以肯定的是,陽性患者需要進(jìn)行額外檢測:有些會造成創(chuàng)傷,有些會令身體不適,有些甚至還具有一定風(fēng)險。當(dāng)然,英國的國家醫(yī)療服務(wù)體系還要為這些數(shù)以萬計(jì)的核磁掃描、活體檢測支付數(shù)百萬英鎊,而這些錢本可以用來支付他汀類藥物、腎移植費(fèi)用或是護(hù)士的工資。此外,前列腺癌的檢測還有很多問題,比如很多情況下前列腺癌細(xì)胞的擴(kuò)散極為緩慢,以至于很多患者根本無法意識到自己得了前列腺癌;有時,直到尸檢這一步,人們才發(fā)現(xiàn)患者患有前列腺癌,但他們的死因卻和前列腺癌毫不相干。

當(dāng)然,這里面還有一個問題,那就是32%的靈敏度、85%的特異度這兩個數(shù)值,其實(shí)是3納克每毫升這項(xiàng)檢測標(biāo)準(zhǔn)造成的。如果我們把檢測標(biāo)準(zhǔn)提高到4納克每毫升,會發(fā)生什么?

答案就是,特異度會從85%升到91%,也就是說該檢測能夠正確識別出更多健康人。但代價是靈敏度會從32%降至21%,也就是說該檢測正確識別癌癥患者的能力下降了。假如這次也有100萬人參加了檢測,那么假陽性人數(shù)會下降至88200,但與此同時真陽性人數(shù)也變少了——20000名患者當(dāng)中只能正確識別出4200人。這種情況下,如果一名50多歲的男性在該檢測中得到了陽性結(jié)果,那他實(shí)際上只有4.5%的概率真正患有前列腺癌,并沒有比之前高多少。

我們無法規(guī)避這些數(shù)據(jù)之前的關(guān)聯(lián)性。我們可以繼續(xù)提高檢測閾值,比如把標(biāo)準(zhǔn)設(shè)定為5納克每毫升,那么假陽性的數(shù)量會進(jìn)一步下降,但代價是假陰性的數(shù)量會進(jìn)一步上升。如果降低檢測閾值,那么假陰性的數(shù)量會下降,但代價是假陽性的數(shù)量會上升。二者互相拖后腿的現(xiàn)象是不可避免的。想要真正解決這一矛盾,我們只能在醫(yī)學(xué)上尋求另一種更優(yōu)秀的檢測方式(這有點(diǎn)像“統(tǒng)計(jì)顯著性”問題,在后文中我們還會具體分析)。


雖然乳腺癌和結(jié)腸癌的篩查更為精準(zhǔn),但即便是在這兩個領(lǐng)域,其準(zhǔn)確性也高度依賴于患者人數(shù)在全部人口中的比例。一項(xiàng)大型調(diào)查發(fā)現(xiàn)[14],在連續(xù)10年、每年都進(jìn)行乳房X光檢查的女性當(dāng)中,有60%的人得到過一次或多次的假陽性結(jié)果,繼而參加了活檢等形式的額外檢查,這些煩瑣的檢查令她們感到“焦慮、痛苦,總是擔(dān)心自己真的得了乳腺癌”。這一切真的值得嗎?答案取決于該疾病在人群中的發(fā)病率,即先驗(yàn)概率。年輕人很少得乳腺癌,如果我們對40歲以下的女性進(jìn)行乳腺癌篩查,那么即便靈敏度和特異度都很高,也會出現(xiàn)較高的假陽性率,所以對大齡女性進(jìn)行乳腺癌篩查會更有價值。英國國家衛(wèi)生與臨床優(yōu)化研究所認(rèn)為,只有對50歲以上的女性進(jìn)行乳腺癌篩查,才具有成本效益。[15]如果不懂貝葉斯定理,我們就無法得出這一結(jié)論。

各位準(zhǔn)父母最好也了解一下貝葉斯定理。市面上有一種叫作“無創(chuàng)產(chǎn)前篩查”(NIPT)的技術(shù),這種技術(shù)會利用孕婦的血液樣本來分析胎兒的染色體狀況。在英國,國家醫(yī)療服務(wù)體系會向高風(fēng)險孕婦提供這一服務(wù)。當(dāng)然你也可以去私人診所,其價格在500英鎊左右。

雖然該篩查的準(zhǔn)確率高達(dá)99%,但就像前面的例子一樣,其準(zhǔn)確率無法幫助我們判斷手中的檢測結(jié)果到底在多大程度上是準(zhǔn)確的。唐氏綜合征、13三體綜合征、18三體綜合征都是這項(xiàng)檢測的目標(biāo)疾病,這些疾病不僅非常罕見,而且相當(dāng)嚴(yán)重。患有唐氏綜合征的孩子,幸運(yùn)的話可以活幾十年,大多需要終生陪護(hù);而患有13三體綜合征、18三體綜合征的孩子通常會在出生后的數(shù)月、數(shù)年之內(nèi)夭折。顯然,檢測結(jié)果是否準(zhǔn)確對父母來說非常重要。

調(diào)查發(fā)現(xiàn)[16],如果參加無創(chuàng)產(chǎn)前篩查的人不是高危孕婦,而是一群普通孕婦,那么檢測結(jié)果往往會呈現(xiàn)假陽性。唐氏綜合征的“陽性預(yù)測值”,即陽性檢測結(jié)果為真陽性的概率為82%,13三體綜合征的為49%,18三體綜合征的為37%。

如果參加無創(chuàng)產(chǎn)前篩查的是一群高危孕婦,那么這些疾病的陽性預(yù)測值會大幅上升——18三體綜合征的陽性預(yù)測值會躍升至84%。也就是說,如果對所有孕婦進(jìn)行無差別檢測,那么每3份陽性結(jié)果中就有2份是假的;如果只對高危孕婦進(jìn)行檢測,那么得到假陽性結(jié)果的概率還不到六分之一。

這背后仍然是貝葉斯定理。手中剛拿到的檢測結(jié)果并不能反映整個事實(shí),我們必須想辦法得到先驗(yàn)概率,而這既不是什么理論假說,也不是什么學(xué)術(shù)難題。如果你已經(jīng)懷上了寶寶,并參加了這些測試,且拿到了陽性結(jié)果,那貝葉斯定理將會成為你應(yīng)該采取何種行動的關(guān)鍵。而且,正如后文所說,你的醫(yī)生也不一定能幫到你,因?yàn)榇蟛糠轴t(yī)生也和普通人一樣,認(rèn)為99%的準(zhǔn)確率就等同于檢測結(jié)果在99%的情況下都是正確的。


和醫(yī)學(xué)界類似,法律界也有一個叫作“檢察官謬誤”(prosecutor’s fallacy)的案例,該案例就犯了沒有認(rèn)真考慮貝葉斯定理的錯誤。該案例是這樣的:假定你正在犯罪現(xiàn)場做犯罪調(diào)查,在兇器上采集到了DNA樣本,且該樣本與數(shù)據(jù)庫中某人的DNA樣本匹配。要知道,DNA匹配的精度極高——平均每300萬個樣本中才能有1個擁有如此高的匹配度。

這是否意味著,嫌疑人只有三百萬分之一的概率是無辜的?讀到這里你應(yīng)該已經(jīng)有能力意識到,事實(shí)并非如此。

你還需要一個信息,即先驗(yàn)概率。你是因?yàn)檎莆樟舜_切證據(jù),才確定了嫌疑人的嗎?還是說你只有DNA匹配這一個理由去懷疑他,而且該DNA數(shù)據(jù)庫是從英國全國人口中隨機(jī)挑選出來的?如果是后者,那么該嫌疑人的確是罪犯的先驗(yàn)概率只有六千八百萬分之一:因?yàn)橛丝跒?800萬,而此起案件的罪犯只有一名。如果你對英國人口進(jìn)行DNA檢測,你會得到大約20份匹配結(jié)果,運(yùn)氣好的話,罪犯也會在里面。在這種情況下,剛好抓到罪犯的概率大約為5%。

但如果你事先能把嫌疑人的范圍縮小至10人,比如你就是神探赫爾克里·波洛,犯罪現(xiàn)場只有10個疑犯,他們被暴風(fēng)雪困在一幢鄉(xiāng)間別墅里,那情況就完全不同了。此時的先驗(yàn)概率是10%,如果10人當(dāng)中有人和現(xiàn)場遺留的DNA匹配上了,那該結(jié)果為假陽性的概率只有大約三十萬分之一。[17]

這不是夸大其詞,也不是故弄玄虛,因?yàn)榉ㄍド险娴挠蟹ü僭灶愃频募?xì)節(jié)給嫌疑人定罪。1990年,一個叫安德魯·迪恩的男性被法庭判有強(qiáng)奸罪,證據(jù)之一就是DNA匹配。當(dāng)時有位專家證人跟法官說,DNA來自其他人的概率只有三百萬分之一。但安德魯·迪恩的罪名還是被推翻了(盡管重審之后還是判他有罪),原因就像某位統(tǒng)計(jì)學(xué)家所解釋的那樣[18],“如果某人是無辜的,他的DNA有多大概率和犯罪現(xiàn)場的DNA匹配?”和“如果某人的DNA和犯罪現(xiàn)場的DNA匹配,他有多大概率是無辜的?”是兩個不同的問題,正如“某人是教皇的可能性”和“某教皇是人的可能性”是不一樣的。

有時謬誤也會反過來。奧倫塔爾·詹姆斯·辛普森是美國橄欖球巨星,曾被指控謀殺自己的妻子妮科爾·布朗·辛普森。在該案的審判過程中,檢方指出辛普森曾對自己的妻子施暴,而辯方表示:“那些打過妻子耳光或毆打過妻子的男性當(dāng)中,只有不到兩千五百分之一的人會在一年之內(nèi)謀殺妻子,這一概率可以說是微乎其微。”[19]

這一謬誤與檢察官謬誤剛好相反。一年之內(nèi)不僅毆打妻子,還進(jìn)一步謀殺妻子的概率,或許真的“只有”兩千五百分之一。但這并不是我們想問的問題。我們想知道的是,如果一個男性毆打妻子,而妻子又被謀殺了,那兇手是她丈夫的概率是多少?

德國心理學(xué)家、風(fēng)險理論專家格爾德·吉仁澤表示,如果兩千五百分之一這個數(shù)字是正確的,那么每10萬名遭受家暴的女性中就有40人會被謀殺。[20]而在整個美國社會中,女性被謀殺的比例為十萬分之五。

由此可見,雖然遭受家暴的美國婦女被丈夫殺害的先驗(yàn)概率約為每年兩千五百分之一,但我們現(xiàn)在可以利用新掌握的信息——已知該婦女是被謀殺的——來修正這個概率。

現(xiàn)在我們把數(shù)據(jù)代入貝葉斯公式。假如某一年有10萬名婦女遭受家暴,那么其中大約會有99955人沒有被謀殺。在被謀殺的45名婦女中,有40名是被她們的丈夫謀殺的。所以我們說,辯方的謬誤與檢察官謬誤剛好相反:他們只使用了先驗(yàn)概率,而忽視了新出現(xiàn)的信息。


貝葉斯定理不僅能夠幫助我們分辨推理中的謬誤,還能告訴我們某些更深刻的東西。借用剛才的一個詞,“相反”往往是問題的關(guān)鍵。通常,統(tǒng)計(jì)學(xué)與概率學(xué)會告訴我們出現(xiàn)某個結(jié)果的概率有多大。如果色子沒被動手腳,那“擲3個色子全是數(shù)字6朝上”這件事,每擲216次才會發(fā)生1次。如果我從未去過犯罪現(xiàn)場,那么我的DNA和現(xiàn)場樣本匹配的概率只有三百萬分之一。

不過我們想知道的往往并不是這些。如果我們懷疑一起玩色子的某人是個老千,那我們可能想知道“如果他擲出了3個6,那這些色子沒被動手腳的概率有多大”。如果某人的DNA和犯罪現(xiàn)場的樣本匹配上了,那我們或許想知道這是一個巧合的概率有多大。這些問題往往都是一些“相反”的問題。

在相當(dāng)長的時間里,概率論所關(guān)心的都是前面那一類問題。但是在托馬斯·貝葉斯(后面我們會介紹他的故事)于18世紀(jì)提出后面的第二類問題之后,類似的“反概率”便逐漸引起了世人的注意。

正如你將在本書中看到的那樣,第二類問題總是能夠引發(fā)大量爭論。貝葉斯定理不僅有大量“信徒”,也有很多“敵人”,從沒有哪個簡短的公式能夠像它一樣引發(fā)如此廣泛的爭議。想想看,你在網(wǎng)上見過有人因?yàn)榍蛎婷娣e公式或歐拉恒等式而吵得不可開交嗎?

我認(rèn)為之所以會出現(xiàn)這種現(xiàn)象,是因?yàn)樨惾~斯定理幾乎影響著一切事物。在已經(jīng)取得某些研究結(jié)果的情況下,某科學(xué)假說為真的概率有多大?好吧,我可以告訴你在該假說為假的情況下,你取得這些研究結(jié)果的概率有多大,可二者并不是一回事。為了研究前者——已經(jīng)有越來越多的科學(xué)家認(rèn)為這才是統(tǒng)計(jì)學(xué)該研究的事情——我們需要貝葉斯定理,需要先驗(yàn)概率。

不僅如此,其實(shí)所有在不確定的情況下做出最終決策的行為,都離不開貝葉斯定理。更準(zhǔn)確地說,貝葉斯定理代表了理想決策,決策人在多大程度上遵循貝葉斯定理,決定著該決策在多大程度上是一個正確決策。蘇格拉底憑借“所有人都會死,蘇格拉底是人,所以蘇格拉底也會死”建立了完整的形式邏輯,而這其實(shí)也只是貝葉斯定理在“非此即彼”這種極端情況下的一個特例而已。

人類似乎就是一臺貝葉斯機(jī)器,這一結(jié)論在相當(dāng)深的層面上是正確的:雖然人類在計(jì)算貝葉斯定理的時候表現(xiàn)得像個垃圾,但我們在日常生活中所做出的那些決定,實(shí)際上和一個理想的貝葉斯決策者所做出的決定幾乎一致。可惜這并不意味著所有人的決定會達(dá)成一致——如果我和你對某件事的先驗(yàn)概率的判斷大相徑庭,那么即便掌握的證據(jù)相同,我們也會得出完全不同的結(jié)論。這就是我們在面對氣候、疫苗等證據(jù)確鑿的問題時,仍會發(fā)自內(nèi)心地出現(xiàn)重大分歧的原因。

在更深的層次上,我們?nèi)匀皇秦惾~斯定理的執(zhí)行者。我們的大腦、感知,似乎都是通過“預(yù)測世界—先驗(yàn)概率—通過感官獲取新數(shù)據(jù)—更新自己的預(yù)測”這種方式工作的。我們對世界的意識體驗(yàn)似乎就是最佳的先驗(yàn)概率。正所謂,我預(yù)測,故我在。

[1] Scott Alexander, ‘Book Review: Surfing Uncertainty’, Slate Star Codex (2017), https://slatestarcodex.com/2017/09/05/book-review-surf-ing-uncertainty

[2] “每只麻雀的死亡”是《圣經(jīng)》中的典故:人類比麻雀更貴重,所以既然上帝會留意到每一只麻雀的死亡,那上帝也一定會關(guān)心每個人的一舉一動。——譯者注

[3] 根據(jù)海森堡不確定性原理,粒子的位置與動量不可同時被確定,因?yàn)槲恢玫牟淮_定性越小,動量的不確定性就越大,反之亦然。——譯者注

[4] Nick Collins, ‘Stephen Hawking: Ten pearls of wisdom’, Daily Telegraph (2010), https://www.telegraph.co.uk/news/science/sci-ence-news/7978898/Stephen-Hawking-ten-pearls-of-wisdom.html

[5] 如果真的一個公式都沒有,我是不是就能賣出……4本書了?感覺也不錯。

[6] 原文為nonconformist,即“不從國教者”,指的是不信奉英格蘭教會(英格蘭國教)的新教徒。——譯者注

[7] H. P. Beck-Bornholdt & H. H. Dubben, ‘Is the Pope an alien?’, Nature 381, 730 (1996), https://doi.org/10.1038/381730d0

[8] S. J. Evans, I. Douglas, M. D. Rawlins et al., ‘Prevalence of adult Hun-tington’s disease in the UK based on diagnoses recorded in general practice records’, Journal of Neurology, Neurosurgery & Psychiatry (2013), 84:1156–60.

[9] M. Alexander Otto, ‘FDA Grants Emergency Authorization for First Rapid Antibody Test for COVID-19’, Medscape (2020), https://www. medscape.com/viewarticle/928150

[10] John Redwood, Twitter (2020), https://twitter.com/johnredwood/ status/1307921384883073024

[11] 假定檢測人數(shù)為100萬,其中有1000人確實(shí)感染了新冠病毒,那么該檢測只能識別出其中的900名患者。剩下的999000人當(dāng)中,該檢測將給出9990份假陽性報(bào)告。所以拿到陽性結(jié)果的人一共有900+9990=10890,真陽性的比例只有900/10890,還不到9%。

[12] ‘What should I advise about screening for prostate cancer?’, NICE (2022), https://cks.nice.org.uk/topics/prostate-cancer/diagnosis/ screening-for-prostate-cancer

[13] P. Rawla, ‘Epidemiology of Prostate Cancer’, World J. Oncol. (2019), Apr., 10(2):63–89, doi: 10.14740/wjon1191

[14] H. D. Nelson, M. Pappas, A. Cantor, J. Griffin, M. Daeges & L. Humphrey, ‘Harms of Breast Cancer Screening: Systematic Review to Update the 2009 U.S. Preventive Services Task Force Recommendation’, Ann. Intern. Med. (2016), Feb. 16, 164(4):256–67, doi: 10.7326/M15-0970

[15] ‘Breast screening’, NICE (2022), https://cks.nice.org.uk/topics/breast-screening/

[16] S. Taylor-Phillips, K. Freeman, J. Geppert et al., ‘Accuracy of non-invasive prenatal testing using cell-free DNA for detection of Down, Edwards and Patau syndromes: a systematic review and meta-analysis’, BMJ Open (2016), 6:e010002, doi: 10.1136/bmjopen-2015-010002

[17] 顯然,這未必意味著他只有三十萬分之一的概率是無辜的——就算不是兇手,他的DNA也有可能以某種方式出現(xiàn)在兇器上。

[18] C. Jowett, ‘Lies, damned lies, and DNA statistics: DNA match testing, Bayes’ theorem, and the Criminal Courts’, Medicine, Science and the Law, 41(3) (2001), pp. 194–205, doi: 10.1177/002580240104100302

[19] Steven Strogatz, ‘Chances Are’, New York Times (2010), https://archive. nytimes.com/opinionator.blogs.nytimes.com/2010/04/25/chances-are/

[20] Gerd Gigerenzer, Reckoning with Risk: Learning to Live with Uncer-tainty, Penguin (2003), p. 141.

主站蜘蛛池模板: 荔波县| 巢湖市| 岚皋县| 中西区| 增城市| 梓潼县| 宁陕县| 花莲市| 瑞昌市| 湘潭市| 台湾省| 安岳县| 长岛县| 钦州市| 双桥区| 雅江县| 托克逊县| 页游| 桦川县| 林西县| 林州市| 保亭| 甘孜| 叙永县| 固阳县| 阳信县| 昂仁县| 建水县| 南通市| 湛江市| 高清| 金昌市| 金塔县| 和平区| 光泽县| 西昌市| 利川市| 贵州省| 甘泉县| 新津县| 建宁县|