官术网_书友最值得收藏!

三、 數據無法告訴我們什么?

數據模型,就像人類一樣,它們總是傾向于根據最可用的信息來做出判斷。但是,有時你所缺失的數據往往會像你所擁有的數據一樣影響你的決策。我們通常將這種類型的可用性偏差與人類決策聯系起來,但人類設計者往往將這種偏差傳遞給自動化系統。


例如,在金融業中,那些擁有大量信貸歷史的人往往比那些沒有信貸歷史的人更容易獲得信貸。后者通常被稱為“瘦檔案”客戶,他們發現自己很難買車,很難租賃房屋,也很難申請到信用卡。 (我們中的一員,一位名叫格雷格的同事,在海外生活15年后回到美國時,就曾親身經歷了這個問題)。


然而,缺少信貸歷史并不必然表明信用風險很高。而信貸公司最終往往僅僅因為缺乏相關數據而放棄潛在的盈利客戶。最近,益百利公司開始通過應用Boost程序來解決這一難題,該程序通過查詢消費者的日常支付活動來使消費者獲得信用評分,比如定期的電信充值和公共事業支付等等。迄今為止,已有數百萬人在該程序上登記注冊了。


因此,要問一問你的數據模型可能遺漏哪些方面,這個問題是極其重要的。如果你正在管理你所測量的數據,你就要確保你所測得的數據真實地反映了現實世界,而不只是一些最容易收集的僵死的數據。


主站蜘蛛池模板: 石景山区| 龙川县| 武安市| 济源市| 光山县| 鹿邑县| 中牟县| 林周县| 新闻| 宜春市| 桃源县| 县级市| 雷州市| 乌拉特后旗| 凌云县| 南平市| 甘南县| 喀喇| 酒泉市| 眉山市| 上栗县| 容城县| 河源市| 都安| 吐鲁番市| 建始县| 方正县| 周至县| 米脂县| 尉氏县| 瓮安县| 桦甸市| 汉川市| 乌兰县| 铜鼓县| 兖州市| 布拖县| 河曲县| 绩溪县| 湖州市| 大英县|