Hadoop大數(shù)據(jù)實(shí)戰(zhàn)權(quán)威指南(第2版)
大數(shù)據(jù)貴在落實(shí)!本書是一本講解大數(shù)據(jù)實(shí)戰(zhàn)的圖書,按照“深入分析組件原理、充分展示搭建過程、詳細(xì)指導(dǎo)應(yīng)用開發(fā)”的指導(dǎo)思想編寫。全書分為三篇,第一篇為大數(shù)據(jù)的基本概念和技術(shù),主要介紹大數(shù)據(jù)的背景、概念、特性及關(guān)鍵技術(shù);第二篇為Hadoop大數(shù)據(jù)平臺搭建與基本應(yīng)用,內(nèi)容涉及Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark等;第三篇為大數(shù)據(jù)處理與項(xiàng)目開發(fā),包括交互式數(shù)據(jù)處理、協(xié)同過濾推薦系統(tǒng)、銷售數(shù)據(jù)分析系統(tǒng),并就京東的部分銷售數(shù)據(jù)使用大數(shù)據(jù)進(jìn)行處理分析。本書適合初學(xué)者入門和進(jìn)階,也可供希望全面、系統(tǒng)地理解并掌握大數(shù)據(jù)實(shí)際應(yīng)用的讀者參考,對從事大數(shù)據(jù)項(xiàng)目開發(fā)的專業(yè)人員也有參考價(jià)值。
·14.7萬字