- 大數據技術原理與應用(第2版)
- 林子雨編著
- 1451字
- 2019-07-30 13:20:20
前言(第2版)
《大數據技術原理與應用》第1版于2015年8月出版,雖然距今僅有一年左右的時間,但是在過去一年里,大數據技術發展迅猛,諸如Spark等新技術迅速崛起,開始改變Hadoop一枝獨秀的市場格局。因此,我們及時對第1版內容進行了補充和修訂,以適應大數據技術的快速發展,保持本書的先進性和實用性。
本書依然沿用第1版的篇章設計,共分四大部分,包括大數據基礎篇、大數據存儲與管理篇、大數據處理與分析篇和大數據應用篇。在大數據基礎篇中,第 1章介紹大數據的基本概念和應用領域,并闡述大數據、云計算和物聯網的相互關系;第2章介紹大數據處理架構Hadoop,并補充介紹了Hadoop版本演化。在大數據存儲與管理篇中,第3章介紹了分布式文件系統HDFS,在編程實踐部分根據最新版本的API進行了修訂;第4章介紹了分布式數據庫HBase,在編程實踐部分根據最新版本的API進行了修訂;第5章介紹了NoSQL數據庫;第6章介紹了云數據庫。在大數據處理與分析篇中,首先在第 7 章介紹了分布式并行編程模型MapReduce,然后在新增的第8章中對Hadoop進行了再探討,介紹了Hadoop的發展演化和一些新特性,并在新增的第9章中介紹了當前比較熱門的、基于內存的分布式計算框架Spark,在第10章和第11章分別介紹了兩種典型的大數據分析技術——流計算和圖計算,最后在第12章簡單介紹了可視化技術。在大數據應用篇中,用3章(第13章~第15章)內容介紹了大數據在互聯網、生物醫學領域和其他行業的典型應用。
本書第1版于2015年8月出版后,廈門大學數據庫實驗室建設了與本書配套的“中國高校大數據課程公共服務平臺”(http://dblab.xmu.edu.cn/post/bigdatateaching- platform/),為教師教學和學生學習大數據課程提供PPT講義、學習指南、備課指南、上機習題、實驗指南、技術資料、授課視頻等全方位、一站式免費服務,并提供面向全國高校的大數據實驗平臺建設方案和大數據課程師資培訓服務。
本書是廈門大學計算機科學系大數據課程的配套教材,根據近幾年的教學實踐,建議安排32學時理論課,16個教學周,每周2學時。每章的具體學時分配如下:第1、3、4、5、6、8、10、11、12、13章每章安排2學時;第2、7、9章每章安排4學時;第14、15章這兩章內容由學生自學完成。已經建設大數據教學實驗室的高校,可以增加16學時上機實踐課,分成4次上機,每次連續4節課,“中國高校大數據課程公共服務平臺”的“教師服務站”為本書提供了配套的上機實驗指南。
本書第1版出版后,筆者收到了大量的讀者來信,對本書提出了許多寶貴的改進意見和建議,這里表示衷心的感謝。同時,筆者舉辦了多期全國高校大數據課程教師培訓交流班和全國高校大數據教學論壇,開展了全國高校大數據公開課巡講計劃與輔助國內高校開設大數據課程公益項目,建立了大數據課程教師交流群,與全國高校大數據課程教師進行了廣泛的接觸、溝通和交流,更好地了解了當前國內高校大數據課程教學發展需求和前進方向,這也為本書第2版撰寫奠定了很好的基礎。這里向參與交流的全國高校大數據課程教師表示衷心的感謝!
本書由林子雨執筆。在撰寫第2版過程中,廈門大學計算機科學系碩士研究生蔡珉星、李雨倩、謝榮東、羅道文、鄧少軍、阮榕城、薛倩、魏亮、曾冠華等做了大量輔助性工作,在此,向他們的辛勤工作表示衷心的感謝。
大數據技術發展日新月異,在今后的工作中,筆者以及廈門大學數據庫實驗室會持續跟蹤大數據技術發展趨勢,把大數據最新技術和本書相關補充資料及時發布到“中國高校大數據課程公共服務平臺”,方便本書讀者通過網絡及時免費獲取相關信息。由于筆者能力有限,書中難免存在不足之處,望廣大讀者不吝賜教。
林子雨
廈門大學計算機科學系數據庫實驗室
2016年9月