- 大數據技術原理與應用(第2版)
- 林子雨編著
- 1387字
- 2019-07-30 13:20:21
前言(第1版)
大數據作為繼云計算、物聯網之后IT行業又一顛覆性的技術,備受人們關注。大數據無處不在,包括金融、汽車、零售、餐飲、電信、能源、政務、醫療、體育、娛樂等在內的社會各行各業,都融入了大數據的印跡,大數據對人類的社會生產和生活必將產生重大而深遠的影響。
大數據時代的到來,迫切需要高校及時建立大數據技術課程體系,為社會培養和輸送一大批具備大數據專業素養的高級人才,滿足社會對大數據人才日益旺盛的需求。本書定位為大數據技術入門教材,為讀者搭建起通向“大數據知識空間”的橋梁和紐帶。本書將系統梳理、總結大數據相關技術,介紹大數據技術的基本原理和大數據的主要應用,幫助讀者形成對大數據知識體系及其應用領域的輪廓性認識,為讀者在大數據領域“深耕細作”奠定基礎、指明方向。在本書的基礎上,感興趣的讀者可以通過其他諸如《Hadoop權威指南》等工具書,繼續深入學習和實踐大數據相關技術。
本書緊緊圍繞“構建知識體系,闡明基本原理,引導初級實踐,了解相關應用”的指導思想,對大數據知識體系進行系統梳理,做到“有序組織、去粗取精、由淺入深、漸次展開”。本書共分四大部分,包括大數據基礎篇、大數據存儲篇、大數據處理與分析篇和大數據應用篇。在大數據基礎篇中,第1章介紹大數據的基本概念和應用領域,并闡述大數據、云計算和物聯網的相互關系;第2章介紹大數據處理架構Hadoop,由于Hadoop已經成為應用最廣泛的大數據技術,因此,本書的大數據相關技術主要圍繞Hadoop展開,包括Hadoop MapReduce、HDFS和HBase,本章是第3、4、7章的基礎。在大數據存儲篇中,用4章(第3~6章)的內容介紹了大數據存儲相關技術的概念與原理,包括分布式文件系統(HDFS)、分布式數據庫(HBase)、NoSQL數據庫和云數據庫。在大數據處理與分析篇,首先在第7章介紹了大數據處理和分析的核心技術——分布式并行編程模型MapReduce,然后,在第8章和第9章分別介紹了大數據時代兩種新興的數據分析技術——流計算和圖計算,最后在第10章簡單介紹了可視化技術。在大數據應用篇,用3章(第11章~第13章)內容介紹了大數據在互聯網、生物醫學領域和其他行業的典型應用。
本書面向高校計算機和信息管理等相關專業的學生,可以作為專業必修課或選修課的教材。在教學過程中,建議安排32學時,16個教學周,每周2學時。每章的具體學時分配如下:第1、2、5、6、8、10、11章每章安排2學時;第3、4、9章每章安排4學時;第7章安排6學時;第12、13章這兩章內容由學生自學完成。
本書由林子雨執筆。在撰寫過程中,廈門大學計算機科學系碩士研究生劉穎杰、葉林寶、蔡珉星、李雨倩、謝榮東、羅道文以及本科生黃梓銘、李粲等做了大量輔助性工作,在此,向這些同學的辛勤工作表示衷心的感謝。
本書官方網站是http://dblab.xmu.edu.cn/post/bigdata,提供教學PPT和相關資料的下載,并接受錯誤反饋和發布教材勘誤信息。廈門大學數據庫實驗室為本教材配套建設了國內高校首個大數據課程公共服務平臺(http://dblab.xmu.edu.cn/post/bigdata-teaching-platform/),為教師教學和學生學習大數據課程提供講義PPT、學習指南、備課指南、上機習題、技術資料、授課視頻等全方位、一站式免費服務。
本書在撰寫過程中,參考了大量國內外的教材、專著、論文和資料,對大數據知識進行了系統梳理,有選擇地把一些重要知識納入本書。本書也是筆者多年在數據科學領域從事教學、科研、產業方面工作的系統總結。由于筆者能力有限,本書難免存在不足之處,望廣大讀者不吝賜教。
林子雨
廈門大學計算機科學系數據庫實驗室
2015年3月
- 基于C語言的程序設計
- AutoCAD快速入門與工程制圖
- Spark編程基礎(Scala版)
- 空間機器人遙操作系統及控制
- MCSA Windows Server 2016 Certification Guide:Exam 70-741
- 空間傳感器網絡復雜區域智能監測技術
- 統計策略搜索強化學習方法及應用
- Implementing AWS:Design,Build,and Manage your Infrastructure
- 自動化生產線安裝與調試(三菱FX系列)(第二版)
- 工業機器人力覺視覺控制高級應用
- Apache Spark Quick Start Guide
- 運動控制系統
- MySQL Management and Administration with Navicat
- 工業機器人與自控系統的集成應用
- Apache Spark Machine Learning Blueprints