官术网_书友最值得收藏!

3.1.3 數據標簽應用

整個數據平臺的最上層是數據集市(Data Market,DM),也是與風控人員聯系最緊密的一層。顧名思義,數據集市就是將數據倉庫中的主題數據根據不同的業務需要挑選出來,構成特定的業務場景標簽。例如想構建與客戶逾期表現相關的標簽,只需要將DW層中與還款相關的表抽取出來加工即可,這樣不僅結構清晰,還保證了標簽計算的效率。由于DM層的數據標簽與業務聯系較為緊密,建議在DM層邏輯設計的初期,讓更多的業務人員參與進來,這樣才能避免后期技術與業務在標簽計算口徑上不統一的問題。

最后想補充說明的是,由于大數據平臺的計算鏈條較長,且充斥著大量的數據處理步驟,在實際生產中平臺的監控和預警機制至關重要,例如對于上下游依賴關系的判斷、每個時間分區數據量的監控、郵件和短信報警等,都是把控數據準確性和時效性的必要手段。

主站蜘蛛池模板: 肇庆市| 金溪县| 达日县| 历史| 项城市| 中西区| 齐河县| 双柏县| 延边| 望奎县| 内黄县| 锦屏县| 同仁县| 高雄市| 诸城市| 沂源县| 葫芦岛市| 洛宁县| 枣庄市| 鹤岗市| 贵定县| 云安县| 上杭县| 安吉县| 丰台区| 景泰县| 长顺县| 太谷县| 房产| 玛曲县| 孟州市| 荃湾区| 兴业县| 万州区| 靖江市| 谢通门县| 绿春县| 松原市| 平昌县| 宜黄县| 安宁市|