Spark分布式處理實戰
本書以項目實踐作為主線,結合必需的理論知識,以任務的形式進行內容設計,每個任務都包含任務描述及任務實施的步驟,讀者按照實施步驟進行操作就可以完成相應的學習任務,從而不斷提升項目實踐能力。本書主要內容涉及Spark基本原理、基于IDEA搭建Spark開發環境、RDD基本原理、SparkSQL基本操作流程、電商業務系統的基本流程、電商用戶行為分析的基本指標以及分析過程、通過不同的維度對銷售數據進行分析、通過不同的維度對訂單數據進行分析以及常用的可視化分析圖表的應用場景等。本書適合需要使用Spark進行大數據處理的程序員、架構師和產品經理作為技術參考和培訓資料,也可作為高校本科生和研究生的教材。
·5.2萬字