- Spark海量數據處理:技術詳解與平臺實戰
- 范東來
- 307字
- 2020-02-14 17:55:29
閱讀方法
本書一共分為3部分,分別為第一部分“基礎篇”、第二部分“應用篇”和第三部分“總結篇”,共16章。
第一部分主要圍繞BDAS(伯克利數據分析棧),不僅會介紹如何開發Spark應用的基礎內容,還會介紹Structured Streaming、Spark機器學習、Spark圖挖掘、Spark深度學習等高級主題,在第一部分的最后一章還會介紹Alluxio。這一部分中包含了很多完整的示例,并附帶了真實的數據集,讀者可以自己進行試驗。
第二部分會實現一個企業背景調查系統,該系統借鑒了數據湖與Lambda架構的思想,涵蓋了批處理、流處理應用開發,并加入了一些開源組件來滿足需求,因此,這一部分既是對第一部分很好的鞏固,又完整呈現了一個大數據應用開發過程。
第三部分是對全書的總結和展望,主要來源于一些業界和學界的進展。