官术网_书友最值得收藏!

大數(shù)據(jù)處理框架Apache Spark設(shè)計與實現(xiàn)
會員

近年來,以ApacheSpark為代表的大數(shù)據(jù)處理框架在學(xué)術(shù)界和工業(yè)界得到了廣泛的使用。本書以ApacheSpark框架為核心,總結(jié)了大數(shù)據(jù)處理框架的基礎(chǔ)知識、核心理論、典型的Spark應(yīng)用,以及相關(guān)的性能和可靠性問題。本書分9章,主要包含四部分內(nèi)容。第一部分大數(shù)據(jù)處理框架的基礎(chǔ)知識(第1~2章):介紹大數(shù)據(jù)處理框架的基本概念、系統(tǒng)架構(gòu)、編程模型、相關(guān)的研究工作,并以一個典型的Spark應(yīng)用為例概述Spark應(yīng)用的執(zhí)行流程。第二部分Spark大數(shù)據(jù)處理框架的核心理論(第3~4章):介紹Spark框架將應(yīng)用程序轉(zhuǎn)化為邏輯處理流程,進(jìn)而轉(zhuǎn)化為可并行執(zhí)行的物理執(zhí)行計劃的一般過程及方法。第三部分典型的Spark應(yīng)用(第5章):介紹迭代型的Spark機(jī)器學(xué)習(xí)應(yīng)用和圖計算應(yīng)用。第四部分大數(shù)據(jù)處理框架性能和可靠性保障機(jī)制(第6~9章):介紹Spark框架的Shuffle機(jī)制、數(shù)據(jù)緩存機(jī)制、錯誤容忍機(jī)制、內(nèi)存管理機(jī)制等。

許利杰等 ·數(shù)據(jù)庫 ·11.9萬字

Python數(shù)據(jù)分析入門:從數(shù)據(jù)獲取到可視化
會員

本書作為數(shù)據(jù)分析的入門圖書,以Python語言為基礎(chǔ),介紹了數(shù)據(jù)分析的整個流程。本書內(nèi)容涵蓋數(shù)據(jù)的獲?。淳W(wǎng)絡(luò)爬蟲程序的設(shè)計)、前期數(shù)據(jù)的清洗和處理、運(yùn)用機(jī)器學(xué)習(xí)算法進(jìn)行建模分析,以及使用可視化的方法展示數(shù)據(jù)及結(jié)果。首先,書中不會涉及過于高級的語法,不過還是希望讀者有一定的語法基礎(chǔ),這樣可以更好地理解本書的內(nèi)容。其次,本書重點(diǎn)在于應(yīng)用Python來完成一些數(shù)據(jù)分析和數(shù)據(jù)處理的工作,即如何使用Python來完成工作而非專注于Python語言語法等原理的講解。本書的目的是讓初學(xué)者不論對數(shù)據(jù)分析流程本身還是Python語言,都能有一個十分直觀的感受,為以后的深入學(xué)習(xí)打下基礎(chǔ)。最后,讀者不必須按順序通讀本書,因為各個章節(jié)層次比較分明,可以根據(jù)興趣或者需要來自行安排。例如第5章介紹了一些實戰(zhàn)的小項目,有趣且難度不大,大家可以在學(xué)習(xí)前面內(nèi)容之余來閱讀這部分內(nèi)容。

沈祥壯 ·數(shù)據(jù)庫 ·6.6萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 上犹县| 华容县| 根河市| 辽宁省| 札达县| 曲麻莱县| 潍坊市| 大埔区| 迁西县| 仁化县| 肥乡县| 松江区| 克拉玛依市| 山东省| 财经| 山东省| 兴文县| 雅安市| 西藏| 明星| 安西县| 格尔木市| 喀喇沁旗| 新野县| 郓城县| 凤城市| 镇平县| 宿松县| 汉中市| 双峰县| 江津市| 太保市| 遂昌县| 灵山县| 华阴市| 沂源县| 花莲县| 家居| 疏勒县| 游戏| 台江县|