- 智能風控與反欺詐:體系、算法與實踐
- 蔡主希
- 344字
- 2021-04-02 09:32:57
3.1.3 數據標簽應用
整個數據平臺的最上層是數據集市(Data Market,DM),也是與風控人員聯系最緊密的一層。顧名思義,數據集市就是將數據倉庫中的主題數據根據不同的業務需要挑選出來,構成特定的業務場景標簽。例如想構建與客戶逾期表現相關的標簽,只需要將DW層中與還款相關的表抽取出來加工即可,這樣不僅結構清晰,還保證了標簽計算的效率。由于DM層的數據標簽與業務聯系較為緊密,建議在DM層邏輯設計的初期,讓更多的業務人員參與進來,這樣才能避免后期技術與業務在標簽計算口徑上不統一的問題。
最后想補充說明的是,由于大數據平臺的計算鏈條較長,且充斥著大量的數據處理步驟,在實際生產中平臺的監控和預警機制至關重要,例如對于上下游依賴關系的判斷、每個時間分區數據量的監控、郵件和短信報警等,都是把控數據準確性和時效性的必要手段。