爱尔兰精灵游戏攻略

書名： Spark海量數據處理：技術詳解與平臺實戰
作者名：范東來
本章字數： 307字
更新時間： 2020-02-14 17:55:29

閱讀方法

本書一共分為3部分，分別為第一部分“基礎篇”、第二部分“應用篇”和第三部分“總結篇”，共16章。

第一部分主要圍繞BDAS（伯克利數據分析棧），不僅會介紹如何開發Spark應用的基礎內容，還會介紹Structured Streaming、Spark機器學習、Spark圖挖掘、Spark深度學習等高級主題，在第一部分的最后一章還會介紹Alluxio。這一部分中包含了很多完整的示例，并附帶了真實的數據集，讀者可以自己進行試驗。

第二部分會實現一個企業背景調查系統，該系統借鑒了數據湖與Lambda架構的思想，涵蓋了批處理、流處理應用開發，并加入了一些開源組件來滿足需求，因此，這一部分既是對第一部分很好的鞏固，又完整呈現了一個大數據應用開發過程。

第三部分是對全書的總結和展望，主要來源于一些業界和學界的進展。

官术网_书友最值得收藏!

Spark海量數據處理：技術詳解與平臺實戰

閱讀方法