- 智能風控:Python金融風險管理與評分卡建模
- 梅子行 毛鑫宇
- 993字
- 2020-06-02 18:29:18
2.3.2 賬齡分析與時間窗口設計
時間窗口分為表現窗口和觀測窗口,表現窗口中的時間稱為表現期,觀察窗口中的時間稱為觀察期。如果定義用戶為負樣本的依據是到期后的3個月內發生逾期,則稱表現期為3個月。在用戶貸款前12個月的數據切片中,抽取用戶的歷史行為表現作為變量,用于后續建模,則稱觀察期為12個月,如圖2-2所示。

圖2-2 觀察期與表現期
通常,時間窗口的確定,需要考慮當前數據集的數據是否充足。如果表現窗口設計過小,則用戶的風險暴露不充分,但觀察窗口可以變長,因此有更豐富的變量信息用于建模。如果表現窗口過大,則觀察窗口可能過小,以至于變量的效果顯著下降。為了更好地確定時間窗口,通常使用賬齡分析來分析賬戶成熟期,進而給出表現期與觀察期的合理劃分。
賬齡(Vintage)一詞最初來源于葡萄酒業,意思是葡萄酒的釀造年份。葡萄成長期缺水、采收期日照不足或者降雨過多等情況都會影響該年葡萄酒的產量與品質,但隨著窖藏年份增加,酒的品質最終將逐漸趨于穩定。因此,葡萄酒廠家通過繪制不同釀造年份的品質曲線,觀察其隨釀造時間的變換規律,進而給出葡萄酒的成熟期、確定最終品質、分析品質影響因素等。
信貸產品中的賬齡分析與葡萄酒行業中的釀造年份分析非常類似。信貸Vintage曲線主要用途包括以下幾點。
●確定資產質量:曲線平緩后可以觀察得到該月份放款客群對應的最終逾期占比。
●分析變化規律:如果前幾期逾期率上升很快,隨后風險暴露進入平穩期,說明短期風險捕捉能力較差,客群欺詐風險可能較高,需要優化欺詐檢測系統。如果曲線一直在上升,說明信用風險識別能力較差,需要對策略和信用評估模型進行優化。
●確定賬戶成熟期:確定用戶風險暴露所需周期,從而定義建模樣本的表現期。
●分析影響因素:放款月的不同會導致很多的因素不同,如風控策略收緊或放松、客群變化、市場環境、政策法規等都會影響資產質量。因此分析影響因素可以用來指導風控策略的調整,在未來市場環境或政策變動時有更好的應對方法。
常見的信貸Vintage圖如圖2-3所示,展示了11個季度的Vintage曲線。其中2017Q1代表2017年第一季度,2019Q2代表2019年第二季度,以此類推。

圖2-3 Vintage圖示
圖2-3中的橫軸表示賬齡,縱軸表示該部分客群的逾期占比,每一條曲線表示一個放款季度的客戶。由于用戶可以在平臺進行復貸,因此用戶的歷史最大逾期會逐步增長,即用戶的真實風險會隨著時間推移逐漸暴露。而當大多數曲線趨于平穩的月份取值都接近某特殊值的時候,即可使用該月份維度作為表現期。