大數(shù)據(jù):從基礎(chǔ)理論到最佳實(shí)踐
本書(shū)側(cè)重于大數(shù)據(jù)的實(shí)踐性技術(shù),系統(tǒng)地介紹了主流大數(shù)據(jù)平臺(tái)及工具的安裝部署、管理維護(hù)和應(yīng)用開(kāi)發(fā)。平臺(tái)和工具的選擇均為當(dāng)前業(yè)界主流的開(kāi)源產(chǎn)品,因此,對(duì)于讀者來(lái)說(shuō),有很強(qiáng)的可操作性。本書(shū)涉及的開(kāi)源技術(shù)包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識(shí)、安裝部署、管理維護(hù)和應(yīng)用開(kāi)發(fā)技術(shù)外,還特別注重案例實(shí)踐,重要的技術(shù)點(diǎn)以實(shí)際工作場(chǎng)景或案例為依托,使讀者能快速入門(mén),參考案例動(dòng)手實(shí)踐,通過(guò)具體深入的實(shí)踐,體會(huì)大數(shù)據(jù)的技術(shù)本質(zhì)特征,領(lǐng)略大數(shù)據(jù)技術(shù)帶來(lái)的創(chuàng)新理念,更好地理解和把握信息技術(shù)的發(fā)展趨勢(shì)。本書(shū)主要內(nèi)容包括以下幾大部分。大數(shù)據(jù)存儲(chǔ)篇:以HDFS為基礎(chǔ),介紹分布式文件系統(tǒng)的原理、安裝、fs命令的使用、編程,介紹如何用HDFS實(shí)現(xiàn),并通過(guò)HTTP調(diào)用。大數(shù)據(jù)計(jì)算篇:以MapReduce、YARN為基礎(chǔ),介紹分布式計(jì)算的原理、部署,以及編程案例。非關(guān)系型數(shù)據(jù)庫(kù)篇:以HBase為基礎(chǔ),重點(diǎn)介紹非關(guān)系型數(shù)據(jù)庫(kù)的優(yōu)勢(shì)、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。大數(shù)據(jù)倉(cāng)庫(kù)篇:以Hive、數(shù)據(jù)倉(cāng)庫(kù)等為基礎(chǔ),重點(diǎn)介紹數(shù)據(jù)的抽取、原理、部署、分析與編程。大數(shù)據(jù)實(shí)時(shí)計(jì)算篇:以Storm、Kafka為基礎(chǔ),介紹實(shí)時(shí)計(jì)算的架構(gòu)、組成、使用與開(kāi)發(fā)。本書(shū)非常適合從事大數(shù)據(jù)技術(shù)開(kāi)發(fā)與使用的初學(xué)者,以及從事大數(shù)據(jù)技術(shù)研發(fā)的企事業(yè)單位工程師學(xué)習(xí)和參考,也適合高校計(jì)算機(jī)相關(guān)專業(yè)的??粕?、本科生和研究生學(xué)習(xí)使用。
·15.2萬(wàn)字