- 智能風(fēng)控與反欺詐:體系、算法與實踐
- 蔡主希
- 282字
- 2021-04-02 09:32:54
2.3.3 變量分箱
客戶的特征數(shù)據(jù)分為離散型變量和連續(xù)型變量兩類。例如學(xué)歷,包括“小學(xué)”“中學(xué)”“大學(xué)”“碩士生”“博士生”等,屬于離散型變量。而客戶的年收入,有可能從幾千到幾十萬不等,屬于連續(xù)型變量。在評分卡模型的開發(fā)中,風(fēng)控人員會傾向于將所有的變量分箱做離散化處理,這樣做一是可以提高模型的穩(wěn)定性,二是可以更好地觀察每個變量和逾期的趨勢關(guān)系。通常一個連續(xù)型變量會按照樣本個數(shù)平均分為10~20個區(qū)間,離散型變量不做操作或者合并一些較為接近的區(qū)間,缺失值單獨作為一個區(qū)間。分箱后的變量在各個區(qū)間內(nèi)的逾期樣本數(shù)量占比要求具有一定的單調(diào)性,并且趨勢與業(yè)務(wù)經(jīng)驗一致,否則去除該變量。
推薦閱讀
- ICO黑洞:創(chuàng)新融資瘋狂的背后
- 蠟燭圖精解:股票和期貨交易的永恒技術(shù)(原書第3版)
- 經(jīng)典股市技術(shù)圖譜大全集
- 中國財富管理發(fā)展指數(shù)
- 互聯(lián)網(wǎng)金融理論與應(yīng)用
- 中國支付行業(yè)的黃金時代(上)
- 期貨交易理論與實務(wù)(微課版)
- 投資與理財
- 國際商務(wù)單證實務(wù)
- 指數(shù)定投實現(xiàn)財務(wù)自由
- 數(shù)字貨幣極簡讀本:理想與現(xiàn)實之間
- 跟我學(xué)做賬
- 互聯(lián)網(wǎng)金融紅利:移動互聯(lián)網(wǎng)時代你該這么活
- 國學(xué)智慧與行為金融學(xué)
- 暗涌的資本