官术网_书友最值得收藏!

2.3.3 變量分箱

客戶的特征數(shù)據(jù)分為離散型變量和連續(xù)型變量兩類。例如學(xué)歷,包括“小學(xué)”“中學(xué)”“大學(xué)”“碩士生”“博士生”等,屬于離散型變量。而客戶的年收入,有可能從幾千到幾十萬不等,屬于連續(xù)型變量。在評分卡模型的開發(fā)中,風(fēng)控人員會傾向于將所有的變量分箱做離散化處理,這樣做一是可以提高模型的穩(wěn)定性,二是可以更好地觀察每個變量和逾期的趨勢關(guān)系。通常一個連續(xù)型變量會按照樣本個數(shù)平均分為10~20個區(qū)間,離散型變量不做操作或者合并一些較為接近的區(qū)間,缺失值單獨作為一個區(qū)間。分箱后的變量在各個區(qū)間內(nèi)的逾期樣本數(shù)量占比要求具有一定的單調(diào)性,并且趨勢與業(yè)務(wù)經(jīng)驗一致,否則去除該變量。

主站蜘蛛池模板: 镇远县| 都安| 通城县| 贺兰县| 汝州市| 宣武区| 贞丰县| 武城县| 万全县| 醴陵市| 彰化市| 县级市| 临清市| 岫岩| 周口市| 岳普湖县| 汝阳县| 眉山市| 冕宁县| 二连浩特市| 武川县| 永丰县| 泌阳县| 广昌县| 偃师市| 化德县| 武乡县| 浦县| 涟水县| 阜宁县| 康平县| 盖州市| 东乌| 自治县| 新乡市| 罗源县| 黄骅市| 合作市| 罗甸县| 甘南县| 桃园县|