用戶畫像:方法論與工程化解決方案
本書從技術維度系統講解了用戶畫像的方法論和一些常見的工程化解決方案。全書共分為9個章節。第一章用戶畫像基礎:講述用戶畫像的一些基礎概念、數據倉庫架構、整個項目開發的流程、以及畫像相關的表結構設計;第二章數據指標體系:從用戶屬性、用戶行為、用戶消費、風險控制等四個維度詳細羅列了常用到的用戶標簽,這些標簽基本涵蓋了大部分場景一半以上的標簽需求。同時介紹了標簽的規范化命名方式;第三章標簽數據存儲:講了為什么使用Hive、MySQL、hbase等數據庫對標簽數據進行存儲,以及存儲實現方式;第四章標簽數據開發:本章是全書的重點章節,講述了統計類標簽、規則類標簽、挖掘類標簽、流式計算類標簽的開發。以及用戶特征庫、人群計算、標簽權重計算、打通數據服務層等方面的開發。;第五章開發性能調優:主要包括數據傾斜調優、開發中間表、讀取小文件處理、redis緩存熱數據等數據性能優化方面;第六章作業流程調度:數據的ETL調度是數據開發中的重要內容,本章主要講了如何使用當下熱門的開源調度工具Airflow進行數據的調度及場景調度異常的排查工作;第七章用戶畫像產品化:開發畫像后的標簽數據,如果只是“躺在”數據倉庫中,并不能發揮更大的業務價值。只有將畫像數據產品化后才能更方便業務方的使用。本章主要講述了產品端的用戶畫像是什么樣子?如何幫助業務人員進行分析,提供服務的;第八章用戶畫像應用:用戶畫像的應用包括用戶分析、商品分析、流量分析、push、短信、郵件等營銷以及站內的個性化推薦等應用場景;第九章實踐案例詳解:前面的八個章節主要從工程化開發的角度講了如何從0到1搭建起用戶畫像系統及其應用場景,本章從完整的工業實踐應用角度,通過兩個實踐案例幫助讀者更好地理解畫像系統是如何切入到應用場景中幫助提升工作效率、提高ROI的。
·8.6萬字