官术网_书友最值得收藏!

2.3.3 變量分箱

客戶的特征數(shù)據(jù)分為離散型變量和連續(xù)型變量兩類。例如學(xué)歷,包括“小學(xué)”“中學(xué)”“大學(xué)”“碩士生”“博士生”等,屬于離散型變量。而客戶的年收入,有可能從幾千到幾十萬不等,屬于連續(xù)型變量。在評分卡模型的開發(fā)中,風(fēng)控人員會傾向于將所有的變量分箱做離散化處理,這樣做一是可以提高模型的穩(wěn)定性,二是可以更好地觀察每個變量和逾期的趨勢關(guān)系。通常一個連續(xù)型變量會按照樣本個數(shù)平均分為10~20個區(qū)間,離散型變量不做操作或者合并一些較為接近的區(qū)間,缺失值單獨作為一個區(qū)間。分箱后的變量在各個區(qū)間內(nèi)的逾期樣本數(shù)量占比要求具有一定的單調(diào)性,并且趨勢與業(yè)務(wù)經(jīng)驗一致,否則去除該變量。

主站蜘蛛池模板: 瑞丽市| 宁陕县| 大石桥市| 梅河口市| 天镇县| 盐池县| 西乡县| 萨迦县| 金溪县| 集贤县| 舒兰市| 陆丰市| 兴城市| 雷波县| 武川县| 西和县| 抚州市| 常熟市| 合水县| 临安市| 康马县| 棋牌| 崇仁县| 三台县| 图木舒克市| 巴东县| 沙雅县| 怀来县| 扎鲁特旗| 余江县| 文昌市| 吉隆县| 新巴尔虎左旗| 湘潭县| 伊川县| 内江市| 丹寨县| 饶平县| 道孚县| 江永县| 义乌市|