官术网_书友最值得收藏!

一、數據是如何得出的?

據說,數據一詞是奇聞軼事的復數形式。英語中有一句俚語,叫“很多奇聞軼事聚在一起就成了數據”。 的確,真實世界的各種事件,如交易記錄、診斷結果和其他諸多相關信息,都被一一記錄下來,并存儲在大型服務器之中,這就是數據。但幾乎沒人會關注這些數據究竟來自哪里,因此,非常不幸的是,我們收集到的數據的質量和處理方式可能會有很大差別。事實的確如此,高德納咨詢公司最近的一項研究揭示出,由于收集到的數據質量太差,每個公司平均損失竟然高達1500萬美元。


一般來說,數據的準確性會受到人為錯誤的影響,例如當低工資和動力不足的零售職員檢查庫存時,他們收集到的數據就往往并不準確。然而,即使數據收集過程是自動化的,也仍然會有很多的錯誤來源,比如手機信號塔的間歇性停電就會造成錯誤;在金融交易清算過程中運用自動化的信息收集方式同樣可能產生錯誤。


質量過差的數據和用于錯誤語境的數據可能比根本沒有數據更為糟糕。事實上,一項研究發現,65%的零售商庫存數據是不準確的。而自歐盟通過并發行了嚴格的GDPR(通用數據保護條例)數據標準以來,另一個日益重要的問題逐漸浮現:在收集數據時是否得到當事人適當的同意。


因此,不要簡單地認為你所擁有的數據是準確的和高質量的。你首先必須關心它是從哪里得來的,以及它是如何維護的。我們越來越需要像做金融交易一樣,小心謹慎地審查我們的數據處理方式。


主站蜘蛛池模板: 贵南县| 江川县| 磴口县| 客服| 邵东县| 宜州市| 原阳县| 调兵山市| 满城县| 佛学| 衢州市| 手游| 西平县| 杭州市| 当雄县| 夹江县| 即墨市| 城市| 襄城县| 府谷县| 台江县| 沈阳市| 临夏县| 栖霞市| 汉阴县| 益阳市| 绥中县| 全南县| 尼勒克县| 石家庄市| 芜湖市| 沾益县| 女性| 陇南市| 泸定县| 台中市| 满城县| 大连市| 喀什市| 巴彦淖尔市| 仙桃市|