官术网_书友最值得收藏!

武志學(xué)

全部作品

大數(shù)據(jù)導(dǎo)論:思維、技術(shù)與應(yīng)用
會員

本書將基本概念與實例相結(jié)合,由淺入深、循序漸進地對大數(shù)據(jù)思維、技術(shù)和應(yīng)用做了全面系統(tǒng)的介紹。全書共12章,分為大數(shù)據(jù)基礎(chǔ)篇、大數(shù)據(jù)存儲篇、大數(shù)據(jù)處理篇、大數(shù)據(jù)挖掘篇和大數(shù)據(jù)應(yīng)用篇。大數(shù)據(jù)基礎(chǔ)篇的內(nèi)容涵蓋了大數(shù)據(jù)思維理念、大數(shù)據(jù)的產(chǎn)生與作用、大數(shù)據(jù)基本概念、大數(shù)據(jù)采集工具Flume和Scribe、大數(shù)據(jù)爬蟲工具Nutch和Scapy、大數(shù)據(jù)預(yù)處理工具Kettle、大數(shù)據(jù)處理架構(gòu)Hadoop;大數(shù)據(jù)存儲篇的內(nèi)容包含分布式文件存儲系統(tǒng)HDFS、海量數(shù)據(jù)存儲數(shù)據(jù)庫系統(tǒng)HBase和海量數(shù)據(jù)倉庫系統(tǒng)Hive;大數(shù)據(jù)處理篇主要介紹了分布式并發(fā)計算批處理模式MapReduce,基于內(nèi)存的快速處理模式Spark,以及基于實時數(shù)據(jù)流的實時處理模式SparkStreaming;大數(shù)據(jù)挖掘篇主要對分類、預(yù)測、聚類和關(guān)聯(lián)等各類大數(shù)據(jù)挖掘算法的原理和使用場景進行了描述,并使用SparkMLlib提供的機器學(xué)習(xí)算法進行了實例講解;大數(shù)據(jù)應(yīng)用篇分別從大數(shù)據(jù)場景應(yīng)用的橫向和縱向出發(fā),介紹了大數(shù)據(jù)在各個功能領(lǐng)域的應(yīng)用場景和在各個行業(yè)的應(yīng)用場景。

武志學(xué) ·自動化 ·17.8萬字

QQ閱讀手機版

主站蜘蛛池模板: 关岭| 昭通市| 曲麻莱县| 南和县| 洛隆县| 海晏县| 嘉黎县| 康定县| 西峡县| 墨竹工卡县| 凌海市| 邢台县| 石泉县| 长岛县| 广西| 京山县| 中超| 安龙县| 泰安市| 富民县| 丹寨县| 甘洛县| 霸州市| 高陵县| 深圳市| 锡林浩特市| 芜湖市| 万宁市| 大足县| 本溪| 临漳县| 平利县| 长白| 新泰市| 高阳县| 土默特右旗| 渝北区| 兴业县| 天气| 津南区| 香河县|