官术网_书友最值得收藏!

閱讀方法

本書一共分為3部分,分別為第一部分“基礎篇”、第二部分“應用篇”和第三部分“總結篇”,共16章。

第一部分主要圍繞BDAS(伯克利數據分析棧),不僅會介紹如何開發Spark應用的基礎內容,還會介紹Structured Streaming、Spark機器學習、Spark圖挖掘、Spark深度學習等高級主題,在第一部分的最后一章還會介紹Alluxio。這一部分中包含了很多完整的示例,并附帶了真實的數據集,讀者可以自己進行試驗。

第二部分會實現一個企業背景調查系統,該系統借鑒了數據湖與Lambda架構的思想,涵蓋了批處理、流處理應用開發,并加入了一些開源組件來滿足需求,因此,這一部分既是對第一部分很好的鞏固,又完整呈現了一個大數據應用開發過程。

第三部分是對全書的總結和展望,主要來源于一些業界和學界的進展。

主站蜘蛛池模板: 区。| 永靖县| 盐城市| 沁水县| 黑山县| 巴楚县| 靖西县| 宁波市| 鄯善县| 巧家县| 肃宁县| 龙山县| 通渭县| 敦化市| 拜城县| 开鲁县| 永福县| 兰州市| 西城区| 辉县市| 抚州市| 郯城县| 镇平县| 洪湖市| 台前县| 廉江市| 汉川市| 公安县| 昌图县| 安西县| 石柱| 凉城县| 通道| 齐齐哈尔市| 台州市| 淳安县| 成安县| 民勤县| 保靖县| 平遥县| 贵州省|