官术网_书友最值得收藏!

大數(shù)據(jù)導(dǎo)論:思維、技術(shù)與應(yīng)用
會(huì)員

本書將基本概念與實(shí)例相結(jié)合,由淺入深、循序漸進(jìn)地對大數(shù)據(jù)思維、技術(shù)和應(yīng)用做了全面系統(tǒng)的介紹。全書共12章,分為大數(shù)據(jù)基礎(chǔ)篇、大數(shù)據(jù)存儲(chǔ)篇、大數(shù)據(jù)處理篇、大數(shù)據(jù)挖掘篇和大數(shù)據(jù)應(yīng)用篇。大數(shù)據(jù)基礎(chǔ)篇的內(nèi)容涵蓋了大數(shù)據(jù)思維理念、大數(shù)據(jù)的產(chǎn)生與作用、大數(shù)據(jù)基本概念、大數(shù)據(jù)采集工具Flume和Scribe、大數(shù)據(jù)爬蟲工具Nutch和Scapy、大數(shù)據(jù)預(yù)處理工具Kettle、大數(shù)據(jù)處理架構(gòu)Hadoop;大數(shù)據(jù)存儲(chǔ)篇的內(nèi)容包含分布式文件存儲(chǔ)系統(tǒng)HDFS、海量數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫系統(tǒng)HBase和海量數(shù)據(jù)倉庫系統(tǒng)Hive;大數(shù)據(jù)處理篇主要介紹了分布式并發(fā)計(jì)算批處理模式MapReduce,基于內(nèi)存的快速處理模式Spark,以及基于實(shí)時(shí)數(shù)據(jù)流的實(shí)時(shí)處理模式SparkStreaming;大數(shù)據(jù)挖掘篇主要對分類、預(yù)測、聚類和關(guān)聯(lián)等各類大數(shù)據(jù)挖掘算法的原理和使用場景進(jìn)行了描述,并使用SparkMLlib提供的機(jī)器學(xué)習(xí)算法進(jìn)行了實(shí)例講解;大數(shù)據(jù)應(yīng)用篇分別從大數(shù)據(jù)場景應(yīng)用的橫向和縱向出發(fā),介紹了大數(shù)據(jù)在各個(gè)功能領(lǐng)域的應(yīng)用場景和在各個(gè)行業(yè)的應(yīng)用場景。

武志學(xué) ·自動(dòng)化 ·17.8萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 兰溪市| 比如县| 平南县| 广宗县| 涟水县| 中宁县| 甘德县| 赤城县| 桦甸市| 应城市| 浑源县| 昌图县| 玉山县| 左云县| 怀仁县| 廉江市| 上饶县| 汉川市| 潞城市| 揭西县| 江源县| 定西市| 连云港市| 江城| 栖霞市| 新闻| 遂平县| 山阴县| 博白县| 尚义县| 瓦房店市| 邢台市| 闻喜县| 雷山县| 克拉玛依市| 富平县| 上虞市| 黄梅县| 浦县| 项城市| 乡城县|