官术网_书友最值得收藏!

大數(shù)據(jù):從基礎(chǔ)理論到最佳實(shí)踐
會(huì)員

本書側(cè)重于大數(shù)據(jù)的實(shí)踐性技術(shù),系統(tǒng)地介紹了主流大數(shù)據(jù)平臺(tái)及工具的安裝部署、管理維護(hù)和應(yīng)用開(kāi)發(fā)。平臺(tái)和工具的選擇均為當(dāng)前業(yè)界主流的開(kāi)源產(chǎn)品,因此,對(duì)于讀者來(lái)說(shuō),有很強(qiáng)的可操作性。本書涉及的開(kāi)源技術(shù)包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識(shí)、安裝部署、管理維護(hù)和應(yīng)用開(kāi)發(fā)技術(shù)外,還特別注重案例實(shí)踐,重要的技術(shù)點(diǎn)以實(shí)際工作場(chǎng)景或案例為依托,使讀者能快速入門,參考案例動(dòng)手實(shí)踐,通過(guò)具體深入的實(shí)踐,體會(huì)大數(shù)據(jù)的技術(shù)本質(zhì)特征,領(lǐng)略大數(shù)據(jù)技術(shù)帶來(lái)的創(chuàng)新理念,更好地理解和把握信息技術(shù)的發(fā)展趨勢(shì)。本書主要內(nèi)容包括以下幾大部分。大數(shù)據(jù)存儲(chǔ)篇:以HDFS為基礎(chǔ),介紹分布式文件系統(tǒng)的原理、安裝、fs命令的使用、編程,介紹如何用HDFS實(shí)現(xiàn),并通過(guò)HTTP調(diào)用。大數(shù)據(jù)計(jì)算篇:以MapReduce、YARN為基礎(chǔ),介紹分布式計(jì)算的原理、部署,以及編程案例。非關(guān)系型數(shù)據(jù)庫(kù)篇:以HBase為基礎(chǔ),重點(diǎn)介紹非關(guān)系型數(shù)據(jù)庫(kù)的優(yōu)勢(shì)、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。大數(shù)據(jù)倉(cāng)庫(kù)篇:以Hive、數(shù)據(jù)倉(cāng)庫(kù)等為基礎(chǔ),重點(diǎn)介紹數(shù)據(jù)的抽取、原理、部署、分析與編程。大數(shù)據(jù)實(shí)時(shí)計(jì)算篇:以Storm、Kafka為基礎(chǔ),介紹實(shí)時(shí)計(jì)算的架構(gòu)、組成、使用與開(kāi)發(fā)。本書非常適合從事大數(shù)據(jù)技術(shù)開(kāi)發(fā)與使用的初學(xué)者,以及從事大數(shù)據(jù)技術(shù)研發(fā)的企事業(yè)單位工程師學(xué)習(xí)和參考,也適合高校計(jì)算機(jī)相關(guān)專業(yè)的專科生、本科生和研究生學(xué)習(xí)使用。

祁偉 ·自動(dòng)化 ·15.2萬(wàn)字

Hadoop + Spark生態(tài)系統(tǒng)操作與實(shí)戰(zhàn)指南
會(huì)員

本書用于Hadoop+Spark快速上手,全面解析Hadoop和Spark生態(tài)系統(tǒng),通過(guò)原理解說(shuō)和實(shí)例操作每一個(gè)組件,讓讀者能夠輕松跨入大數(shù)據(jù)分析與開(kāi)發(fā)的大門。全書共12章,大致分為3個(gè)部分,第1部分(第1~7章)講解Hadoop的原生態(tài)組件,包括Hadoop、ZooKeeper、HBase、Hive環(huán)境搭建與安裝,以及介紹MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本環(huán)境下實(shí)戰(zhàn)操作。第2部分(第8~11章)講解Spark的原生態(tài)組件,包括SparkCore、SparkSQL、SparkStreaming、DataFrame,以及介紹Scala、SparkAPI、SparkSQL、SparkStreaming、DataFrame原理和CDH版本環(huán)境下實(shí)戰(zhàn)操作,其中Flume和Kafka屬于Apache頂級(jí)開(kāi)源項(xiàng)目也放在本篇講解。第3部分(第12章)講解兩個(gè)大數(shù)據(jù)項(xiàng)目,包絡(luò)網(wǎng)頁(yè)日志離線項(xiàng)目和實(shí)時(shí)項(xiàng)目,在CDH版本環(huán)境下通過(guò)這兩個(gè)項(xiàng)目將Hadoop和Spark原生態(tài)組件進(jìn)行整合,一步步帶領(lǐng)讀者學(xué)習(xí)和實(shí)戰(zhàn)操作。本書適合想要快速掌握大數(shù)據(jù)技術(shù)的初學(xué)者,也適合作為高等院校和培訓(xùn)機(jī)構(gòu)相關(guān)專業(yè)師生的教學(xué)參考書和實(shí)驗(yàn)用書。

余輝 ·自動(dòng)化 ·7.3萬(wàn)字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 富裕县| 松原市| 平塘县| 新邵县| 新源县| 临汾市| 浦城县| 绩溪县| 三门县| 常德市| 桐城市| 上饶县| 吉安市| 吉林市| 交城县| 拉萨市| 黄陵县| 长武县| 武威市| 津市市| 阳曲县| 海晏县| 汕尾市| 连城县| 通州区| 长泰县| 五台县| 井陉县| 竹溪县| 五家渠市| 清丰县| 阳泉市| 永福县| 大港区| 金平| 镇赉县| 富源县| 沭阳县| 华宁县| 清徐县| 吉木萨尔县|