基于Hadoop與Spark的大數(shù)據(jù)開(kāi)發(fā)實(shí)戰(zhàn)
大數(shù)據(jù)技術(shù)讓我們以一種前所未有的方式,對(duì)海量數(shù)據(jù)進(jìn)行分析,從中獲得有巨大價(jià)值的產(chǎn)品和服務(wù),最終形成變革之力。本書(shū)圍繞Hadoop和Spark兩個(gè)主流大數(shù)據(jù)技術(shù)進(jìn)行講解,主要內(nèi)容包括Hadoop環(huán)境配置、Hadoop分布式文件系統(tǒng)(HDFS)、Hadoop分布式計(jì)算框架MapReduce、Hadoop資源調(diào)度框架YARN與Hadoop新特性、Hadoop分布式數(shù)據(jù)庫(kù)HBase、數(shù)據(jù)倉(cāng)庫(kù)Hive、大數(shù)據(jù)離線(xiàn)處理輔助系統(tǒng)、SparkCore、SparkSQL、SparkStreaming等知識(shí)。本書(shū)緊密結(jié)合實(shí)際應(yīng)用,運(yùn)用大量案例說(shuō)明和實(shí)踐,提煉含金量十足的開(kāi)發(fā)經(jīng)驗(yàn)。另外,本書(shū)配以多元的學(xué)習(xí)資源和支持服務(wù),包括視頻教程、案例素材下載、學(xué)習(xí)交流社區(qū)、討論組等學(xué)習(xí)內(nèi)容,為讀者帶來(lái)全方位的學(xué)習(xí)體驗(yàn)。
·12.6萬(wàn)字