數(shù)據(jù)科學(xué)工程實(shí)踐:用戶行為分析與建模、A/B實(shí)驗(yàn)、SQLFlow
這是一本將數(shù)據(jù)科學(xué)三要素——商業(yè)理解、量化模型、數(shù)據(jù)技術(shù)全面打通的實(shí)戰(zhàn)性著作,是來自騰訊、滴滴、快手等一線互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師和算法工程師的經(jīng)驗(yàn)總結(jié),得到了SQLFlow創(chuàng)始人以及騰訊、網(wǎng)易、快手、貝殼找房、谷歌等企業(yè)的專家一致好評和推薦。全書三個(gè)部分,內(nèi)容相對獨(dú)立,既能幫助初學(xué)者建立知識體系,又能幫助從業(yè)者解決商業(yè)中的實(shí)際問題,還能幫助有經(jīng)驗(yàn)的專家快速掌握數(shù)據(jù)科學(xué)的Z新技術(shù)和發(fā)展動向。內(nèi)容圍繞非實(shí)驗(yàn)環(huán)境下的觀測數(shù)據(jù)的分析、實(shí)驗(yàn)的設(shè)計(jì)和分析、自助式數(shù)據(jù)科學(xué)平臺3大主題展開,涉及統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)、機(jī)器學(xué)習(xí)、實(shí)驗(yàn)科學(xué)等多個(gè)領(lǐng)域,包含大量常用的數(shù)據(jù)科學(xué)方法、簡潔的代碼實(shí)現(xiàn)和經(jīng)典的實(shí)戰(zhàn)案例。第1部分(第1~6章)觀測數(shù)據(jù)的分析技術(shù)講解了非實(shí)驗(yàn)環(huán)境下不同觀測數(shù)據(jù)分析場景所對應(yīng)的分析框架、原理及實(shí)際操作,包括消費(fèi)者選擇偏好分析、消費(fèi)者在時(shí)間維度上的行為分析、基于機(jī)器學(xué)習(xí)的用戶生命周期價(jià)值預(yù)測、基于可解釋模型技術(shù)的商業(yè)場景挖掘、基于矩陣分解技術(shù)的用戶行為規(guī)律發(fā)現(xiàn)與挖掘,以及在不能進(jìn)行實(shí)驗(yàn)分析時(shí)如何更科學(xué)地進(jìn)行全量評估等內(nèi)容。第二部分(第7~9章)實(shí)驗(yàn)設(shè)計(jì)和分析技術(shù)從A/B實(shí)驗(yàn)的基本原理出發(fā),深入淺出地介紹了各種商業(yè)場景下進(jìn)行實(shí)驗(yàn)設(shè)計(jì)需要參考的原則和運(yùn)用的方法,尤其是在有樣本量約束條件下提升實(shí)驗(yàn)效能的方法及商業(yè)場景限制導(dǎo)致的非傳統(tǒng)實(shí)驗(yàn)設(shè)計(jì)。第三部分(第10~12章)自助式數(shù)據(jù)科學(xué)平臺SQLFlow針對性的講解了開源的工程化的自助式數(shù)據(jù)科學(xué)平臺SQLFlow,并通過系統(tǒng)配置、黑盒模型的解讀器應(yīng)用、聚類分析場景等案例幫助讀者快速了解這一面向未來的數(shù)據(jù)科學(xué)技術(shù)。
·13萬字