官术网_书友最值得收藏!

1.1.2 因果與相關(guān)

從恩格斯的系統(tǒng)論觀點出發(fā),系統(tǒng)之所以成為“系統(tǒng)”,關(guān)鍵是組成系統(tǒng)的各個部分之間存在著相互聯(lián)系與相互作用,當然,相互作用也可理解為聯(lián)系的一種。聯(lián)系可以是一種寬泛的概念,例如,男女之間通過法律結(jié)為夫妻聯(lián)系,孩子與父母之間通過血緣形成父(母)子聯(lián)系,鄰居之間通過居住在同一棟樓而形成鄰里聯(lián)系等。在這里我們探討的系統(tǒng)中的聯(lián)系是指系統(tǒng)中兩個變量之間存在著聯(lián)動關(guān)系,即如果對象A的變化會引起對象B的變化,我們稱對象A與對象B之間存在著聯(lián)系,或者稱存在著相關(guān)性。

好奇的天性總驅(qū)使人們在遇到事情發(fā)生的時候常常會去問為什么。是什么因?qū)е铝诉@樣的果,即系統(tǒng)中的因果聯(lián)系。人們從孩提時代起,就總是不自覺地去總結(jié)身邊所發(fā)生事物的因果模型,并將其作為指導行為決策的依據(jù),例如,我們常常會說,勤奮學習才能取得好的成績,努力工作才會取得好的業(yè)績。科學研究的核心目標也是不斷發(fā)現(xiàn)外部世界中存在的因果模型,如牛頓三定律,就是發(fā)現(xiàn)了外力與物體運動狀態(tài)改變之間的因果關(guān)系,并建立了確定的數(shù)學模型,即F=ma

這里需要厘清一個重要的概念,那就是相關(guān)性不等于因果性。相關(guān)性體現(xiàn)了兩個事物之間相互關(guān)聯(lián)的程度,可分為正相關(guān)性與負相關(guān)性。我們通過大數(shù)據(jù)分析中的數(shù)據(jù)關(guān)聯(lián)度量分析,采用“相關(guān)分析”與“回歸分析”的方法手段,便能判斷出數(shù)據(jù)之間的相關(guān)性,但我們無法簡單地判斷數(shù)據(jù)之間的因果性。在數(shù)據(jù)的相關(guān)性方面有一個非常經(jīng)典的案例,那就是美國沃爾瑪超市的啤酒和尿布的啟示。美國沃爾瑪超市管理人員在分析銷售數(shù)據(jù)時發(fā)現(xiàn),在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關(guān)系的商品會經(jīng)常出現(xiàn)在同一個購物籃中,這種現(xiàn)象經(jīng)常出現(xiàn)在年輕的父親身上。于是沃爾瑪開始在賣場嘗試將啤酒與尿布擺放在相同的區(qū)域,讓年輕的父親可以同時找到這兩件商品,并很快地完成購物,從而在獲得很好的商品銷售收入的同時也收獲了年輕父親顧客的滿意度。在這里沃爾瑪超市利用的就是通過數(shù)據(jù)分析獲得的不同對象之間的相關(guān)性,但啤酒與尿布之間并不存在必然的因果性,如果是年輕媽媽來買尿布,顯然并不會同時購買啤酒。我們對系統(tǒng)中的聯(lián)系、相關(guān)性與因果性的概念內(nèi)涵進行區(qū)分,三者的關(guān)系如圖1-3所示,聯(lián)系是一個更為寬泛的概念,聯(lián)系包含相關(guān)性聯(lián)系,而因果性是一種更為確定的相關(guān)性,因果性包含于相關(guān)性,但不等同于相關(guān)性。

圖1-3 系統(tǒng)內(nèi)的聯(lián)系、相關(guān)性與因果性的關(guān)系圖

在分析相關(guān)性與因果性的概念時還有兩個重要的概念也需要了解,那就是統(tǒng)計概率相關(guān)性和條件概率相關(guān)性。我們通過一個例子來介紹統(tǒng)計概率相關(guān)性。在新冠疫情流行時疫苗的重要性尤為凸顯,但疫苗有極低的概率會導致不良反應(yīng),甚至會危及生命,如西方曾發(fā)生過多起阿斯利康疫苗引起致命血栓的事件,會給人造成疫苗不安全的錯覺,也就是打疫苗和防控新冠疫情之間的相關(guān)性是否有效。我們可以通過統(tǒng)計數(shù)據(jù)來分析。我們知道某款新冠疫苗接種的不良反應(yīng)率為每10萬人中有57人,該疫苗預(yù)防重癥的有效性為90%。另據(jù)世衛(wèi)組織統(tǒng)計,新冠的重癥率為 1.9%。假設(shè)有 90%的人接種了該疫苗。就以10萬人為例,我們將不良反應(yīng)人員歸為重癥人員,這樣不良反應(yīng)造成的重癥人員為57人,有90000人接種了疫苗,未接種人數(shù)為10000人。其中接種的90000人中有9000人的防護失效,按照重癥率計算,有重癥人數(shù)為9000×1.9%=171人;未接種人數(shù)中有重癥人數(shù)為10000×1.9%=190人;在10萬人中共有重癥人數(shù)為57+171+190=418人。如果不接種疫苗,10萬人按照重癥比例,100000×1.9%=1900人,這樣可以計算出通過接種疫苗每10萬人中減少的重癥人數(shù)為1482人,即減少了78%。我們通過統(tǒng)計數(shù)據(jù)分析,證明了接種疫苗與預(yù)防重癥病例之間的因果關(guān)系,但我們嘗試建立因果關(guān)系模型時,還需要考慮二者之間的統(tǒng)計概率值。

在考慮因果性的還有一個重要的概念需要理解,那就是貝葉斯概率,即條件概率。在因果關(guān)系的世界里,往往不是一對一的,造成一個時間發(fā)生的原因可能存在多個,在前面已發(fā)生過的條件下,后續(xù)事件發(fā)生的概率計算就不是一種獨立事件計算模式。舉一個簡單的例子,在一個箱子里放3個紅球與3個白球,實驗人員從箱子里依次摸2個球,如果摸出球后不放回,且第一次摸中了一個紅球,求第二次摸球摸中紅球的概率。在這里,實驗人員第二次摸球顯然不能算作獨立事件,需要考慮第一次摸球?qū)Φ诙蚊虻挠绊懀吹谝淮蚊驐l件成立下的第二次摸球的概率。對于這種問題做出重大貢獻的是18世紀英國的數(shù)學家貝葉斯,他提出了條件概率計算公式,即PB|A)=PAB)/PA)。

主站蜘蛛池模板: 新邵县| 那曲县| 石台县| 农安县| 无锡市| 桦川县| 三河市| 宁德市| 安吉县| 白山市| 友谊县| 鞍山市| 沁水县| 三原县| 莱西市| 开原市| 宽甸| 子长县| 桐庐县| 留坝县| 平舆县| 屯留县| 奉节县| 枣强县| 张家界市| 玉环县| 东乡族自治县| 临西县| 辉县市| 濮阳县| 南部县| 侯马市| 河南省| 酒泉市| 孝义市| 濮阳市| 仁化县| 清流县| 阳江市| 类乌齐县| 乐陵市|