官术网_书友最值得收藏!

推薦序3
閑得沒事也別胡扯

王大鵬 中國科普研究所副研究員,中國科普作家協(xié)會理事

非常榮幸,作為第一批讀者,提前通讀了《拆穿數(shù)據(jù)胡扯》一書。讀完之后,掩卷深思,頓感這是一本遲來的好書,一來因為我們已經(jīng)對很多“噪聲”習以為常,而且深受其害,如果我們能早些明白這些“噪聲”的來龍去脈,那么也許就可能“看開”很多世事;二來呢,對于一個專門研究科普的人來說,這本書也讓我受益良多,如果我們能把書中提到的一些方法用到科普實踐之中,那么我們可以少走一些彎路,也能早些傳授給目標受眾一些科學方法。

如果你仔細閱讀全書,就會發(fā)現(xiàn)它談論的實際上是我們每天都在遇到甚至是從事的一種行為,那就是“胡扯”。我相信即便你沒有閱讀全書,哪怕只是瀏覽一下章節(jié)目錄,你也會得出這樣的結論。

確實如此,這本書就是關于“胡扯”的,雖然我沒有去統(tǒng)計,但是我敢說“胡扯”這個詞是書中出現(xiàn)頻率最高的一個名詞,有時候也是動詞。當然,這本書雖然是有關“胡扯”的,但是它沒有胡扯,而是去辨別胡扯,那么為什么不用這個直截了當?shù)拿郑ū鎰e胡扯)作為書名呢?兩位作者指出,“是因為要解決當前胡扯泛濫的問題,需要的不僅僅是看清它的本質,還要照亮所有角落,讓胡扯無所遁形,增加胡扯傳播的難度。”那么他們是如何一步步地做到這一點的呢?我個人的體會如下。

首先,作者們追根溯源,主張“胡扯”無處不在,它起源于更廣泛意義上的欺騙。有一句很多人耳熟能詳?shù)脑挕翱萍甲屔罡篮谩薄2贿^,兩位作者認為技術的進步并沒有消除“胡扯”的問題,而是使現(xiàn)狀惡化了。比如在社交媒體大行其道的時代,“標題黨”也是某種意義上的“胡扯”,它是一種“空熱量”,因為有研究發(fā)現(xiàn),最成功的標題都沒有闡述事實,而是承諾給你一種情感體驗。而如果缺乏這種情感體驗,估計很多人都不會去閱讀“吸睛”標題背后的內容。算法是很多平臺賴以獲取用戶黏性的利器,但是在“算法叢林”中,它們并不是為了幫我們了解更多信息,而是讓我們在平臺上保持活躍度,否則我們就有可能會跑到它的競品平臺上去。這實際上就會導致“過濾器泡泡”和“回音壁效應”,本身也是一種“胡扯”的表現(xiàn)。錯誤信息和虛假信息也會借助技術的發(fā)展而不斷地迭代,你有時候并不知道網(wǎng)絡那一端和你互動的到底是人還是機器。就此而言,“胡扯在點擊驅動的大規(guī)模網(wǎng)絡化社交媒體世界中比在以前的任何社會環(huán)境中更容易傳播”。

通過上述分析,兩位作者總結說,“胡扯就是全然不顧事實、邏輯連貫性或實際傳遞的信息,而是利用語言、統(tǒng)計數(shù)字、數(shù)據(jù)圖表和其他表現(xiàn)形式,通過分散注意力、震懾或恐嚇等方法,達到說服或打動聽話人的目的”。因為“胡扯的目的根本不是表述事實,而是利用某種修辭手段來掩蓋事實”。

當然,讀者們可能會說,我們可以用數(shù)據(jù)說話,但是兩位作者以機器學習的例子說明“數(shù)字成了胡扯者的撒手锏”。因為機器學習算法的好壞取決于它的訓練數(shù)據(jù),而這些訓練數(shù)據(jù)從根本上來說可能是有問題的。

其次,科學也會牽涉到“胡扯”的問題。在這個問題上,我個人的感覺是,兩位作者的著墨最多。無論是因果關系、選擇偏倚、數(shù)據(jù)可視化,還是大數(shù)據(jù)問題,以及科學的易感性,本書中間部分的第4—9章幾乎都可以歸于這方面的討論。

把相關性呈現(xiàn)為因果性往往是“胡扯”的一種表現(xiàn),也是一種“胡扯”的做法。比如,在大眾媒體的報道中,往往會基于相關性就認為存在因果關系,而我們在上面讀到的很多權威性推薦意見依據(jù)的都是關聯(lián)性,沒有證據(jù)證明存在因果關系(在此之后,因此之故)。

作者們之所以主張“數(shù)字成了胡扯者的撒手锏”,是因為僅僅數(shù)字正確是不夠的,還需要將它們放在合適的上下文中,以便讀者或聽眾能夠正確地理解它們。否則,這些數(shù)字就有可能會成為某種意義上的“胡扯”。在這方面,兩位作者給出了大量的案例來支撐自己的主張,他們還認為并非所有的東西都可以用數(shù)學公式來表示,將其界定為“數(shù)學濫用”。與此類似的是,在數(shù)據(jù)可視化方面,兩位作者也通過各種各樣出現(xiàn)在我們身邊的可視化圖形闡釋了這可能導致的“胡扯”現(xiàn)象。

在科學的易感性問題上,兩位作者著重探討了p值及其操縱的問題。科學研究領域很少或者說不發(fā)表負面(用科學術語來說是,陰性的)研究結果,實際上也是某種p值操縱,這會導致發(fā)表的偏倚。而媒體報道又進一步放大了這些偏倚,因為新聞來源往往不明確說明他們所報道的只是初步的研究結果,更糟糕的是,他們幾乎不會報道之前報道過的研究后來沒有成功的消息,“難怪公眾會被那些不能確定紅酒到底是好是壞的科學家攪得暈頭轉向,也難怪他們很快就對所有媒體產(chǎn)生了懷疑”。更甚的是,還存在著“胡扯科學”的市場,也就是那些掠奪性期刊。當然,兩位作者在這一章的最后重申,科學依然是重要的,我們需要相信科學。

最后,經(jīng)過本書前面大部分的鋪墊之后,兩位作者給出了如何辨別胡扯的一些小“妙招”,包括但不限于,我們要學會“質疑信息來源”,“小心不公平的比較”,牢記“如果好得或者糟糕得不像是真的……”那它很可能就不是真的,我們要知道“從數(shù)量級考慮”,我們要去“避免證真偏差”(也就是人們會注意、相信和分享與我們已有信念相一致的信息),以及我們需要“考慮多個假設”,等等。當然,掌握了辨別“胡扯”的方法,我們可以使自己免受其害,如果我們還能夠駁斥“胡扯”,那就更好了,因為這樣就可以讓我們周圍的人免受其害。兩位作者也提供了一些方法。

如果你還不知道什么是“胡扯”,或者想學會辨別“胡扯”的方法,又或者想約束自己減少“胡扯”,避免分享“胡扯”,這本書都是你的不二之選。

從個人的專業(yè)角度而言,我更是強烈建議科普從業(yè)者認真閱讀一下這本書,因為它會讓你掌握一些必要的科普方法。

總之,強烈推薦!

主站蜘蛛池模板: 含山县| 定结县| 英德市| 修武县| 江永县| 田林县| 天门市| 辽源市| 蒲城县| 莱阳市| 卓尼县| 甘南县| 育儿| 邵阳县| 阿尔山市| 道孚县| 扎赉特旗| 弥渡县| 内黄县| 北辰区| 抚州市| 朔州市| 栖霞市| 河源市| 新竹市| 城口县| 林口县| 丰镇市| 福安市| 宾阳县| 资中县| 周至县| 邛崃市| 浮梁县| 洪洞县| 琼中| 卢龙县| 象山县| 庆元县| 济阳县| 滨海县|