官术网_书友最值得收藏!

前言

為何寫作本書

互聯(lián)網(wǎng)金融與金融科技是數(shù)據(jù)從業(yè)者較為關(guān)注的方向之一。風(fēng)險(xiǎn)控制是金融的核心。信貸場景下的風(fēng)險(xiǎn),很大程度上取決于貸款人的信用風(fēng)險(xiǎn)。因此,如何對(duì)貸款用戶的信用風(fēng)險(xiǎn)進(jìn)行合理度量,是信貸平臺(tái)關(guān)注的首要問題。

信貸風(fēng)控的建模方法由來已久,筆者在另一本著作《智能風(fēng)控:原理、算法與工程實(shí)踐》中重點(diǎn)介紹了互聯(lián)網(wǎng)金融場景下機(jī)器學(xué)習(xí)在金融科技中的應(yīng)用方法與技術(shù)實(shí)現(xiàn)。市面上大多數(shù)信用評(píng)分建模的指導(dǎo)書籍都是基于SAS開發(fā)或不涉及工程實(shí)現(xiàn)的。因此,為推廣傳統(tǒng)信用評(píng)分方法,我們決定撰寫本書。

本書完整地介紹了如何基于Python語言從0到1建立信用評(píng)分模型,并系統(tǒng)介紹了建立模型之后,如何通過拒絕推斷及校準(zhǔn)來修正模型與真實(shí)場景的偏差。此外,本書還介紹了如何上線部署,以及后續(xù)的監(jiān)控與迭代中的注意事項(xiàng)。希望讀者閱讀本書后,可以學(xué)習(xí)到規(guī)范、完整的評(píng)分卡建模體系,可以使用Python獨(dú)立地建立標(biāo)準(zhǔn)評(píng)分卡模型,并通過模型與策略相組合的方法實(shí)現(xiàn)對(duì)貸款用戶的信用管理。

本書主要內(nèi)容

第1章主要介紹了信用管理的基礎(chǔ)知識(shí)。風(fēng)控場景對(duì)業(yè)務(wù)知識(shí)的儲(chǔ)備有較高要求,而市面上也缺少相關(guān)名詞的規(guī)范化材料,因此本章對(duì)相關(guān)術(shù)語進(jìn)行了解釋,并給出了統(tǒng)一的定義。此外,本章還詳細(xì)地介紹了現(xiàn)階段企業(yè)的風(fēng)險(xiǎn)控制架構(gòu)。了解整個(gè)風(fēng)控框架,有助于讀者理解場景中的具體問題的成因,從而精準(zhǔn)定義問題,理解每一項(xiàng)技術(shù)的原理。

第2章主要介紹評(píng)分卡的相關(guān)概念,規(guī)范了評(píng)分卡模型的建模流程。從適用客群和用途兩個(gè)角度揭示了從業(yè)者定義評(píng)分卡的思路,并且對(duì)整個(gè)建模流程中最重要的步驟——模型設(shè)計(jì),進(jìn)行了詳細(xì)的梳理。此外,本章還對(duì)常用于評(píng)分卡建模的數(shù)據(jù)進(jìn)行了解讀。

第3章主要講解了評(píng)分卡建模中常用的機(jī)器學(xué)習(xí)算法。從機(jī)器學(xué)習(xí)基礎(chǔ)出發(fā),由簡單的線性回歸,逐步進(jìn)階到具有良好解釋性的邏輯回歸模型。除直接用于評(píng)分卡建模的邏輯回歸模型外,本章還介紹了幾種常用的輔助建模模型。最后,還介紹了一些模型之間相互取長補(bǔ)短的合并方法,它們?cè)趯?shí)踐和數(shù)據(jù)挖掘競賽中也有較好的效果。

第4章主要介紹了幾種常用的用戶分群方法,同時(shí)系統(tǒng)地介紹了決策樹模型和高斯混合聚類模型的原理,并給出了一種基于決策樹模型和卡方分箱實(shí)現(xiàn)自動(dòng)生成策略組合的分析方法。雖然用戶分群并非評(píng)分卡建模的必備流程,但在大多數(shù)情況下,它可以為業(yè)務(wù)帶來實(shí)際收益。

第5章主要介紹了探索性數(shù)據(jù)分析、特征衍生、特征變換的基本方法。由于評(píng)分卡中常用的廣義線性模型只使用了特征的簡單加權(quán)求和信息,缺乏對(duì)特征的深度挖掘能力,因此評(píng)分卡模型對(duì)人工特征工程的要求遠(yuǎn)高于其他場景。這一章介紹的特征衍生與特征變換操作是評(píng)分卡建模過程中非常重要的環(huán)節(jié),該過程耗費(fèi)的時(shí)間通常會(huì)占整個(gè)開發(fā)流程的60%~70%。

第6章主要介紹了特征篩選和模型訓(xùn)練方法。評(píng)分卡模型對(duì)穩(wěn)定性的要求通常要高于準(zhǔn)確性,因此需要對(duì)建模使用的特征進(jìn)行精細(xì)化調(diào)優(yōu)與篩選。特征變換調(diào)優(yōu)過程在第5章中有相關(guān)介紹,特征篩選方法則主要集中在第6章。這一章的末尾為讀者展示了一個(gè)建立評(píng)分卡模型的案例。希望讀者可以通過該案例理解前6章所介紹的技術(shù)是如何應(yīng)用的。

第7章主要介紹了如何對(duì)建立好的評(píng)分卡模型進(jìn)行拒絕推斷。信用評(píng)分模型本身是一種擁有拒絕屬性的模型,幸存者偏差問題會(huì)導(dǎo)致每次迭代的模型逐漸偏離真實(shí)環(huán)境下的數(shù)據(jù)分布,因此需要通過數(shù)據(jù)驗(yàn)證、標(biāo)簽分裂、數(shù)據(jù)推斷等方法對(duì)現(xiàn)有模型進(jìn)行修正。

第8章主要介紹了評(píng)分卡模型建立之后的應(yīng)用邏輯和校準(zhǔn)方法。模型只是一種嵌入在策略體系中的技術(shù)手段,其本質(zhì)是為策略服務(wù)的。在實(shí)際應(yīng)用中,模型分?jǐn)?shù)也常常作為一條單獨(dú)的規(guī)則進(jìn)行配置。由于一些難以避免的原因,評(píng)分卡模型通常需要進(jìn)行校準(zhǔn),因此這一章對(duì)常用的校準(zhǔn)方法及其使用場景進(jìn)行了梳理。

第9章主要介紹了模型開發(fā)后的記錄工作。由于在實(shí)際工作中常常需要多人進(jìn)行交互,且經(jīng)常需要回溯很久之前開發(fā)過的模型詳情,因此保證每一個(gè)模型都擁有詳細(xì)的記錄是非常重要的。這一章給出了一個(gè)完整的評(píng)分卡模型開發(fā)文檔,以便于讀者參考,從而完善現(xiàn)有的模型記錄文檔。

本書內(nèi)容特色

與市面上其他建模或機(jī)器學(xué)習(xí)相關(guān)的技術(shù)書籍相比,本書主要使用Python語言編寫,詳細(xì)介紹了傳統(tǒng)信用管理中所涉及的基礎(chǔ)知識(shí)、技術(shù)與工程實(shí)現(xiàn)。從統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)的角度出發(fā),系統(tǒng)、全面地介紹了風(fēng)險(xiǎn)數(shù)據(jù)分析中的基礎(chǔ)概念與建模技術(shù)。本書作為“智能風(fēng)控”系列的第二本書,對(duì)《智能風(fēng)控:原理、算法與工程實(shí)踐》一書的基礎(chǔ)內(nèi)容進(jìn)行了補(bǔ)充。讀者選擇本書為入門讀物,將《智能風(fēng)控:原理、算法與工程實(shí)踐》一書作為進(jìn)階讀物,則可以由淺入深地掌握信貸領(lǐng)域的分析建模技術(shù)。

此外,市面上類似的介紹數(shù)據(jù)建模、算法理論的書很容易陷入平鋪直敘的窘境,條理性和嚴(yán)謹(jǐn)性有余而生動(dòng)性不足,特別是對(duì)于廣大初學(xué)者而言,一本容易閱讀的書更為有價(jià)值。因此,筆者特邀請(qǐng)知名插畫師毛鑫宇為本書手繪漫畫與插圖,使本書內(nèi)容表達(dá)形式生動(dòng)、有趣,貼近生活,希望讀者在閱讀本書的過程中不會(huì)感到枯燥乏味。

本書讀者對(duì)象

本書主要面向希望從事風(fēng)險(xiǎn)控制工作的分析師、建模師、算法工程師,也適合有一定統(tǒng)計(jì)基礎(chǔ)的在校學(xué)生和對(duì)使用Python實(shí)現(xiàn)自動(dòng)化信用管理感興趣的讀者。

資源和勘誤

本書力求完美,但由于作者水平有限,錯(cuò)誤和疏漏之處在所難免。在此,誠懇地期望得到各領(lǐng)域的專家和廣大讀者的批評(píng)與指正。

獲取更多相關(guān)資料以及提出反饋意見,請(qǐng)關(guān)注公眾號(hào)“大數(shù)據(jù)風(fēng)控與機(jī)器學(xué)習(xí)”,后臺(tái)添加作者微信,加入讀者交流群,與更多從業(yè)者一起共同學(xué)習(xí)。書中相關(guān)代碼可從“華章計(jì)算機(jī)”公眾號(hào)獲取,回復(fù)“智能風(fēng)控”即可。

致謝

首先,我必須要感謝本書的另外一位作者,同時(shí)也是本書封面、插畫設(shè)計(jì)者——毛鑫宇老師。毛老師是我十多年的好朋友,也是一位非常謙虛、低調(diào)、有才華的設(shè)計(jì)師。在過去的一年里,他在完美地完成本職工作的同時(shí),陪著我一同創(chuàng)作了“智能風(fēng)控”系列書,并在我遇到困難、多次想要放棄的時(shí)候,堅(jiān)定地站在了我的身后。毫不夸張地說,這本書至少有一半功勞屬于毛老師。毛老師在百般推辭后才接受在本書封面署名。

其次,我要感謝李志勇教授、黃穎(知乎ID:黃姐姐Hjj)、趙越(知乎ID:微調(diào))、馮海杰(知乎ID:求是汪在路上)、梁辰龍(公眾號(hào)/知乎“金科應(yīng)用研院”負(fù)責(zé)人)等數(shù)十位好友在日常交流和工作中對(duì)本人的指導(dǎo)。上述各位的書籍、專欄、公眾號(hào)為包括我在內(nèi)的廣大風(fēng)控從業(yè)者提供了極大的幫助,同時(shí)也是許多從業(yè)者入門與進(jìn)階的指南。本書對(duì)各位專家的作品也有所借鑒,在此感謝亦師亦友的各位對(duì)本書的大力支持。

感謝toad庫開發(fā)者、前厚本金融數(shù)科團(tuán)隊(duì)的周偉鵬、周夕鈺、董少乾等多位好友。他們開發(fā)的toad庫穩(wěn)健、快速、功能強(qiáng)大,幾乎囊括了評(píng)分卡開發(fā)應(yīng)用過程中所需的全部功能,為本書的寫作帶來了極大便利。相信在未來的發(fā)展與優(yōu)化中,toad庫會(huì)成為廣大風(fēng)控從業(yè)者必備的開發(fā)工具。

感謝機(jī)械工業(yè)出版社的楊福川老師和欒傳龍老師。兩位老師為本書花費(fèi)了大量的個(gè)人時(shí)間,并在本書的創(chuàng)作過程中提出了寶貴的修改建議。

特別感謝林超穎、陳國棟、張斌斌等領(lǐng)導(dǎo)、同事的支持和理解。滿幫集團(tuán)是一家學(xué)習(xí)氛圍非常濃厚的公司,我在滿幫集團(tuán)工作的日子非常快樂。此外,還要感謝因篇幅限制而沒有提及名字的各位同事,非常感謝各位對(duì)我工作上的指導(dǎo),以及思想和生活上的幫助。

最后感謝購買本書的讀者,希望本書能為您帶來一些收獲。

梅子行

2020年3月

主站蜘蛛池模板: 句容市| 合肥市| 嘉义县| 凌云县| 西盟| 界首市| 汕尾市| 银川市| 乌海市| 会理县| 西乌| 玉田县| 慈溪市| 治县。| 定日县| 时尚| 静海县| 定南县| 原阳县| 临桂县| 肃宁县| 卢龙县| 班玛县| 什邡市| 富宁县| 桃源县| 清流县| 左云县| 建始县| 瑞金市| 汽车| 祁连县| 安宁市| 婺源县| 法库县| 沁水县| 义马市| 广宗县| 汝州市| 邵武市| 德格县|