推薦系統(tǒng)全鏈路設計:原理解讀與業(yè)務實踐
這是一本指導中高級從業(yè)者高質(zhì)量落地現(xiàn)代推薦系統(tǒng),圍繞現(xiàn)代推薦系統(tǒng)核心技術展開深度解讀的專業(yè)工具書,又是一套完整的推薦系統(tǒng)高質(zhì)量落地解決方案。本書基于推薦算法工程師實際工作場景規(guī)劃內(nèi)容,融合了作者在阿里巴巴、58同城等多家大廠做推薦系統(tǒng)設計和優(yōu)化的經(jīng)驗,是一本方法和實踐兼具的好書。本書不針對零基礎從業(yè)者,而是以幫助初級算法工程師向中高級進階為目標。書中從底層剖析推薦系統(tǒng)在實際業(yè)務場景中可能出現(xiàn)的各種問題,直指問題的本質(zhì),并按照推薦系統(tǒng)工作流程逐一破解。本書共包括11章:第1章主要介紹推薦系統(tǒng)在各個互聯(lián)網(wǎng)業(yè)務場景中的落地情況,包括構(gòu)建推薦系統(tǒng)可能面臨的問題,以及電商、視頻、電子書、廣告系統(tǒng)、信息流、拉活促銷等相關推薦系統(tǒng)落地指導。第2章介紹現(xiàn)代推薦系統(tǒng)的整體架構(gòu),以幫助讀者從宏觀層面整體了解推薦系統(tǒng)。第3章對推薦系統(tǒng)所需要的數(shù)據(jù)和特征處理進行深度剖析,包括數(shù)據(jù)的收集、非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化清洗、連續(xù)特征處理和離散特征處理等重點內(nèi)容。第4章對推薦系統(tǒng)的在線指標和離線指標,以及AB實驗的設計進行深度講解。第5章和第6章,主要對機器學習和神經(jīng)網(wǎng)絡的設計和調(diào)參進行詳細解讀。這是本書的重點,也是很多推薦算法工程師的痛點。這部分包括XGBoost的重要參數(shù)調(diào)優(yōu)、集成學習最DA化推薦效果利用、DNN網(wǎng)絡深度和寬度的影響、激活函數(shù)的選擇、優(yōu)化器選擇、損失函數(shù)、過/欠擬合等內(nèi)容。第7~9章分別對召回層、精排層、粗排層進行詳細解讀,包括5種召回方案、4種精排建模方式、2種粗排設計方案,以及模型可解釋性、近離線計算等重點內(nèi)容。第10章主要介紹精排模型的分析方法,重排模型(PRM、生成式重排模型)和混排(混排的原理和強化學習在混排的應用)的原理。第11章主要介紹冷啟動鏈路的設計,主要包括新用戶如何冷啟動、新物料如何冷啟動和冷啟動涉及的流量分配算法。這是本書的特色內(nèi)容。
·13.8萬字