官术网_书友最值得收藏!

一、數據是如何得出的?

據說,數據一詞是奇聞軼事的復數形式。英語中有一句俚語,叫“很多奇聞軼事聚在一起就成了數據”。 的確,真實世界的各種事件,如交易記錄、診斷結果和其他諸多相關信息,都被一一記錄下來,并存儲在大型服務器之中,這就是數據。但幾乎沒人會關注這些數據究竟來自哪里,因此,非常不幸的是,我們收集到的數據的質量和處理方式可能會有很大差別。事實的確如此,高德納咨詢公司最近的一項研究揭示出,由于收集到的數據質量太差,每個公司平均損失竟然高達1500萬美元。


一般來說,數據的準確性會受到人為錯誤的影響,例如當低工資和動力不足的零售職員檢查庫存時,他們收集到的數據就往往并不準確。然而,即使數據收集過程是自動化的,也仍然會有很多的錯誤來源,比如手機信號塔的間歇性停電就會造成錯誤;在金融交易清算過程中運用自動化的信息收集方式同樣可能產生錯誤。


質量過差的數據和用于錯誤語境的數據可能比根本沒有數據更為糟糕。事實上,一項研究發現,65%的零售商庫存數據是不準確的。而自歐盟通過并發行了嚴格的GDPR(通用數據保護條例)數據標準以來,另一個日益重要的問題逐漸浮現:在收集數據時是否得到當事人適當的同意。


因此,不要簡單地認為你所擁有的數據是準確的和高質量的。你首先必須關心它是從哪里得來的,以及它是如何維護的。我們越來越需要像做金融交易一樣,小心謹慎地審查我們的數據處理方式。


主站蜘蛛池模板: 呼玛县| 岢岚县| 石楼县| 社旗县| 二手房| 南充市| 建水县| 襄樊市| 长春市| 雅江县| 石台县| 定边县| 卢湾区| 潮安县| 右玉县| 确山县| 沭阳县| 儋州市| 永宁县| 汕尾市| 杂多县| 台东县| 正定县| 阿拉善左旗| 民勤县| 棋牌| 循化| 池州市| 高台县| 汉中市| 宜丰县| 北安市| 吉安市| 鸡西市| 三江| 芒康县| 营山县| 闸北区| 曲水县| 新余市| 沧州市|