Spark快速大數(shù)據(jù)分析(第2版)
本書的主角是在大數(shù)據(jù)時代應(yīng)運(yùn)而生的數(shù)據(jù)處理與分析利器——Spark。你將通過豐富的示例學(xué)習(xí)如何使用Spark的結(jié)構(gòu)化數(shù)據(jù)API,利用SparkSQL進(jìn)行交互式查詢,掌握Spark應(yīng)用的優(yōu)化之道,用Spark和DeltaLake等開源工具構(gòu)建可靠的數(shù)據(jù)湖,并用MLlib庫實(shí)現(xiàn)機(jī)器學(xué)習(xí)流水線。隨著Spark從2.x版本升級到3.0版本,本書第2版做了全面的更新,以體現(xiàn)Spark生態(tài)系統(tǒng)在機(jī)器學(xué)習(xí)、流處理技術(shù)等方面的發(fā)展,另新增一章詳解Spark3.0引入的新特性。
·14.7萬字