基于Hadoop與Spark的大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)
大數(shù)據(jù)技術(shù)讓我們以一種前所未有的方式,對(duì)海量數(shù)據(jù)進(jìn)行分析,從中獲得有巨大價(jià)值的產(chǎn)品和服務(wù),最終形成變革之力。本書圍繞Hadoop和Spark兩個(gè)主流大數(shù)據(jù)技術(shù)進(jìn)行講解,主要內(nèi)容包括Hadoop環(huán)境配置、Hadoop分布式文件系統(tǒng)(HDFS)、Hadoop分布式計(jì)算框架MapReduce、Hadoop資源調(diào)度框架YARN與Hadoop新特性、Hadoop分布式數(shù)據(jù)庫HBase、數(shù)據(jù)倉庫Hive、大數(shù)據(jù)離線處理輔助系統(tǒng)、SparkCore、SparkSQL、SparkStreaming等知識(shí)。本書緊密結(jié)合實(shí)際應(yīng)用,運(yùn)用大量案例說明和實(shí)踐,提煉含金量十足的開發(fā)經(jīng)驗(yàn)。另外,本書配以多元的學(xué)習(xí)資源和支持服務(wù),包括視頻教程、案例素材下載、學(xué)習(xí)交流社區(qū)、討論組等學(xué)習(xí)內(nèi)容,為讀者帶來全方位的學(xué)習(xí)體驗(yàn)。
·12.6萬字