官术网_书友最值得收藏!

三、 數據無法告訴我們什么?

數據模型,就像人類一樣,它們總是傾向于根據最可用的信息來做出判斷。但是,有時你所缺失的數據往往會像你所擁有的數據一樣影響你的決策。我們通常將這種類型的可用性偏差與人類決策聯系起來,但人類設計者往往將這種偏差傳遞給自動化系統。


例如,在金融業中,那些擁有大量信貸歷史的人往往比那些沒有信貸歷史的人更容易獲得信貸。后者通常被稱為“瘦檔案”客戶,他們發現自己很難買車,很難租賃房屋,也很難申請到信用卡。 (我們中的一員,一位名叫格雷格的同事,在海外生活15年后回到美國時,就曾親身經歷了這個問題)。


然而,缺少信貸歷史并不必然表明信用風險很高。而信貸公司最終往往僅僅因為缺乏相關數據而放棄潛在的盈利客戶。最近,益百利公司開始通過應用Boost程序來解決這一難題,該程序通過查詢消費者的日常支付活動來使消費者獲得信用評分,比如定期的電信充值和公共事業支付等等。迄今為止,已有數百萬人在該程序上登記注冊了。


因此,要問一問你的數據模型可能遺漏哪些方面,這個問題是極其重要的。如果你正在管理你所測量的數據,你就要確保你所測得的數據真實地反映了現實世界,而不只是一些最容易收集的僵死的數據。


主站蜘蛛池模板: 高雄市| 宝应县| 玉田县| 轮台县| 黄龙县| 双流县| 门头沟区| 华坪县| 金坛市| 清涧县| 肥西县| 陇川县| 阜城县| 荣昌县| 建湖县| 轮台县| 密山市| 扶绥县| 长治县| 许昌县| 奉节县| 双辽市| 茂名市| 民勤县| 关岭| 徐水县| 鹤岗市| 仙游县| 文昌市| 呈贡县| 砚山县| 砚山县| 温宿县| 偏关县| 乌兰浩特市| 迭部县| 新竹市| 鄢陵县| 恩施市| 阳朔县| 察雅县|