Spark快速大數據分析(第2版)
本書的主角是在大數據時代應運而生的數據處理與分析利器——Spark。你將通過豐富的示例學習如何使用Spark的結構化數據API,利用SparkSQL進行交互式查詢,掌握Spark應用的優化之道,用Spark和DeltaLake等開源工具構建可靠的數據湖,并用MLlib庫實現機器學習流水線。隨著Spark從2.x版本升級到3.0版本,本書第2版做了全面的更新,以體現Spark生態系統在機器學習、流處理技術等方面的發展,另新增一章詳解Spark3.0引入的新特性。
·14.7萬字