Hadoop 3實(shí)戰(zhàn)指南
本書主要分析Hadoop3.2.0的新特性和新功能,共5章。首先簡單介紹Hadoop,讓剛接觸Hadoop的讀者對它有個基本了解;接著介紹目前使用比較多的分布式文件系統(tǒng)HDFS,內(nèi)容涉及NameNode的原理、HA、HDFSFederation和HDFS3.0中新增的特性;然后從應(yīng)用管理和資源調(diào)度這兩個方面介紹一個通用的資源管理平臺YARN;再后討論如何在YARN平臺中運(yùn)行應(yīng)用,比如如何將應(yīng)用遷移到Y(jié)ARN平臺,以及非Hadoop的應(yīng)用是如何兼容YARN模式的。最后,書中給出了一些工作實(shí)戰(zhàn)指南,包括如何搭建一個生產(chǎn)可用的Hadoop3.0集群;如何將現(xiàn)有Hadoop2.0集群升級到Hadoop3.0,及其在升級過程中遇到的問題;如何針對Hadoop進(jìn)行二次開發(fā),并參與社區(qū),向社區(qū)貢獻(xiàn)代碼;一個大數(shù)據(jù)平臺應(yīng)具備哪些必備組件等。
·8.3萬字