官术网_书友最值得收藏!

Hadoop與大數(shù)據(jù)挖掘(第2版)
會(huì)員

這是一本講解如何基于Hadoop技術(shù)棧進(jìn)行大數(shù)據(jù)挖掘和分析的著作。它能帶領(lǐng)你零基礎(chǔ)快速掌握Hadoop技術(shù)棧,以及基于它的大數(shù)據(jù)挖掘與分析的流程和方法。全書核心內(nèi)容分為兩部分。1.Hadoop技術(shù)棧:詳細(xì)講解了Hadoop、Hive、HBase、Spark、Flume、Kafka等大數(shù)據(jù)技術(shù)的基礎(chǔ)、原理、應(yīng)用,通過(guò)這部分內(nèi)容讀者能對(duì)Hadoop技術(shù)棧有從宏觀到微觀的了解。2.Hadoop大數(shù)據(jù)挖掘:通過(guò)3個(gè)綜合案例,逐步展示了基于Hadoop的大數(shù)據(jù)挖掘的完整流程和方法。幾位作者在大數(shù)據(jù)項(xiàng)目研發(fā)、教育、咨詢等領(lǐng)域有10余年的豐富經(jīng)驗(yàn),對(duì)教育界和企業(yè)界供需兩端的了解非常深入,全書的結(jié)構(gòu)和內(nèi)容圍繞這兩端的需求盡心設(shè)計(jì),能讓Hadoop大數(shù)據(jù)挖掘與分析的教育和學(xué)習(xí)事半功倍。本書第1版出版后,獲得了教育界和企業(yè)界的良好反饋,其中數(shù)十家高等院校采用本書作為教材或參考書。第2版在第1版的基礎(chǔ)上,在技術(shù)適應(yīng)性、案例實(shí)用性等方面做了大量更新,與時(shí)俱進(jìn),更有競(jìng)爭(zhēng)力!為了便于學(xué)習(xí)和教學(xué),本書配套數(shù)據(jù)文件、實(shí)現(xiàn)代碼、課后習(xí)題、教學(xué)PPT。

王哲 張良均等 ·數(shù)據(jù)庫(kù) ·14.7萬(wàn)字

標(biāo)簽類目體系:面向業(yè)務(wù)的數(shù)據(jù)資產(chǎn)設(shè)計(jì)方法論
會(huì)員

本書共9章,分為3篇。由來(lái)篇(第1~3章)首先分析了當(dāng)前各企業(yè)在數(shù)據(jù)建設(shè)過(guò)程中會(huì)遇到的6大數(shù)據(jù)困局,然后重點(diǎn)介紹了為應(yīng)對(duì)這些數(shù)據(jù)困局而逐漸發(fā)展出的標(biāo)簽類目體系這一數(shù)據(jù)資產(chǎn)構(gòu)建方法論及其定位、定義,最后闡述了采用該方法建設(shè)數(shù)據(jù)資產(chǎn)的3點(diǎn)必要性:資產(chǎn)可復(fù)用、業(yè)務(wù)可理解、價(jià)值可衡量。理論篇(第4~6章)詳細(xì)講解了標(biāo)簽類目體系方法論的4個(gè)核心原理、從核心原理衍生出的3個(gè)構(gòu)建前提和6個(gè)設(shè)計(jì)步驟,以及標(biāo)簽方法論在實(shí)施落地過(guò)程中的具體使用技法與核心問題。實(shí)踐篇(第7~9章)重點(diǎn)介紹了當(dāng)前可用來(lái)提升標(biāo)簽類目體系的設(shè)計(jì)、使用、運(yùn)營(yíng)效率的標(biāo)簽工具和經(jīng)典模板,列舉了從標(biāo)簽到應(yīng)用的5個(gè)最佳實(shí)踐方案,并總結(jié)了標(biāo)簽化的價(jià)值、典型應(yīng)用案例及標(biāo)簽設(shè)計(jì)人才的培養(yǎng)經(jīng)驗(yàn)。

任寅姿 季樂樂 ·數(shù)據(jù)庫(kù) ·15.5萬(wàn)字

大數(shù)據(jù)處理框架Apache Spark設(shè)計(jì)與實(shí)現(xiàn)
會(huì)員

近年來(lái),以ApacheSpark為代表的大數(shù)據(jù)處理框架在學(xué)術(shù)界和工業(yè)界得到了廣泛的使用。本書以ApacheSpark框架為核心,總結(jié)了大數(shù)據(jù)處理框架的基礎(chǔ)知識(shí)、核心理論、典型的Spark應(yīng)用,以及相關(guān)的性能和可靠性問題。本書分9章,主要包含四部分內(nèi)容。第一部分大數(shù)據(jù)處理框架的基礎(chǔ)知識(shí)(第1~2章):介紹大數(shù)據(jù)處理框架的基本概念、系統(tǒng)架構(gòu)、編程模型、相關(guān)的研究工作,并以一個(gè)典型的Spark應(yīng)用為例概述Spark應(yīng)用的執(zhí)行流程。第二部分Spark大數(shù)據(jù)處理框架的核心理論(第3~4章):介紹Spark框架將應(yīng)用程序轉(zhuǎn)化為邏輯處理流程,進(jìn)而轉(zhuǎn)化為可并行執(zhí)行的物理執(zhí)行計(jì)劃的一般過(guò)程及方法。第三部分典型的Spark應(yīng)用(第5章):介紹迭代型的Spark機(jī)器學(xué)習(xí)應(yīng)用和圖計(jì)算應(yīng)用。第四部分大數(shù)據(jù)處理框架性能和可靠性保障機(jī)制(第6~9章):介紹Spark框架的Shuffle機(jī)制、數(shù)據(jù)緩存機(jī)制、錯(cuò)誤容忍機(jī)制、內(nèi)存管理機(jī)制等。

許利杰等 ·數(shù)據(jù)庫(kù) ·11.9萬(wàn)字

ORACLE 11g權(quán)威指南
會(huì)員

本書從數(shù)據(jù)庫(kù)的基礎(chǔ)知識(shí)入手,全面系統(tǒng)地介紹了Oracle數(shù)據(jù)庫(kù)11g的所有特性,并配以翔實(shí)的示例,嚴(yán)謹(jǐn)?shù)恼撌觯钊胩接懥诉@些特性的細(xì)節(jié)內(nèi)容,同時(shí)具有很強(qiáng)的可操作性和實(shí)用性。全書內(nèi)容共37章,分為7大部分:第一部分為Oracle數(shù)據(jù)庫(kù)11g基礎(chǔ);第二部分為Oracle數(shù)據(jù)庫(kù)11g管理;第三部分為Oracle數(shù)據(jù)庫(kù)11g的備份與恢復(fù);第四部分為Oracle數(shù)據(jù)庫(kù)11g集群技術(shù)與高可用性;第五部分為商業(yè)智能與數(shù)據(jù)倉(cāng)庫(kù);第六部分為非結(jié)構(gòu)化數(shù)據(jù)庫(kù):包括空間數(shù)據(jù)庫(kù)和XML數(shù)據(jù)庫(kù);第七部分為Oracle數(shù)據(jù)庫(kù)11g其他新特性,對(duì)Oracle11g應(yīng)用增強(qiáng)、高級(jí)數(shù)據(jù)庫(kù)管理和數(shù)據(jù)庫(kù)升級(jí)等新特性進(jìn)行了詳細(xì)講解。本書是Oracle數(shù)據(jù)庫(kù)11g所有特性的集大成介紹,可供Oracle數(shù)據(jù)庫(kù)管理員、Oracle數(shù)據(jù)庫(kù)應(yīng)用開發(fā)人員、Oracle數(shù)據(jù)倉(cāng)庫(kù)工程師使用及作為Oracle技術(shù)支持和培訓(xùn)結(jié)構(gòu)、高等院校數(shù)據(jù)庫(kù)課程的參考教材。

谷長(zhǎng)勇 王彬 單永紅 陳杰等編著 ·數(shù)據(jù)庫(kù) ·46.2萬(wàn)字

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)
會(huì)員

本書以Python數(shù)據(jù)分析與挖掘的常用技術(shù)與真實(shí)案例相結(jié)合的方式,深入淺出地介紹Python數(shù)據(jù)分析與挖掘的重要內(nèi)容。本書共11章,分為基礎(chǔ)篇(第1~5章)和實(shí)戰(zhàn)篇(第6~11章),基礎(chǔ)篇包括數(shù)據(jù)挖掘基礎(chǔ)、Python數(shù)據(jù)挖掘編程基礎(chǔ)、數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘算法基礎(chǔ)等基礎(chǔ)知識(shí);實(shí)戰(zhàn)篇包括6個(gè)案例,分別為信用卡高風(fēng)險(xiǎn)客戶識(shí)別、餐飲企業(yè)菜品關(guān)聯(lián)分析、金融服務(wù)機(jī)構(gòu)資金流量預(yù)測(cè)、O2O優(yōu)惠券使用預(yù)測(cè)、電視產(chǎn)品個(gè)性化推薦,以及基于TipDM大數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)金融服務(wù)機(jī)構(gòu)資金流量預(yù)測(cè)。本書大部分章節(jié)包含實(shí)訓(xùn)和課后習(xí)題,通過(guò)練習(xí)和操作實(shí)踐,可幫助讀者鞏固所學(xué)的內(nèi)容。本書可作為“1+X”證書制度試點(diǎn)工作中的大數(shù)據(jù)應(yīng)用開發(fā)(Python)職業(yè)技能等級(jí)(高級(jí))證書的教學(xué)和培訓(xùn)用書,也可作為高校數(shù)據(jù)科學(xué)或人工智能相關(guān)專業(yè)的教材,還可作為數(shù)據(jù)挖掘愛好者的自學(xué)用書。

翟世臣 張良均主編 ·數(shù)據(jù)庫(kù) ·13.6萬(wàn)字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 信丰县| 湾仔区| 桑植县| 红原县| 昭苏县| 凉城县| 西宁市| 于都县| 莫力| 东宁县| 贞丰县| 林周县| 江城| 滦南县| 西吉县| 苏尼特右旗| 稻城县| 深水埗区| 恩施市| 崇仁县| 罗田县| 秭归县| 正阳县| 南汇区| 新野县| 宁河县| 西城区| 铜陵市| 龙海市| 武义县| 友谊县| 南雄市| 霍邱县| 福海县| 民权县| 清徐县| 喀喇沁旗| 旬邑县| 溧阳市| 建瓯市| 芒康县|