- 大數據技術原理與應用(第2版)
- 林子雨編著
- 525字
- 2019-07-30 13:20:28
第二篇 大數據存儲與管理
本篇內容
本篇介紹大數據存儲與管理相關技術的概念與原理,包括Hadoop分布式文件系統(HDFS)、分布式數據庫(HBase)、NoSQL數據庫和云數據庫。HDFS提供了在廉價服務器集群中進行大規模分布式文件存儲的能力。HBase是一個高可靠、高性能、面向列、可伸縮的分布式數據庫,主要用來存儲非結構化和半結構化的松散數據。NoSQL數據庫可以支持超大規模數據存儲,靈活的數據模型可以很好地支持Web 2.0應用,具有強大的橫向擴展能力,可以有效彌補傳統關系型數據庫的不足。云數據庫是部署和虛擬化在云計算環境中的數據庫,可以將用戶從繁瑣的數據庫硬件定制中解放出來,同時讓用戶擁有強大的數據庫擴展能力,滿足各種不同類型用戶的數據存儲需求。需要特別指出的是,雖然云數據庫在概念上更偏向于云計算的范疇,但是云計算和大數據是密不可分的兩種技術,不能割裂看待,而且了解云數據庫有助于拓展對大數據存儲和管理方式的認識,因此本篇內容介紹了云數據庫的概念和相關產品。
本篇包括 4 章。第 3 章介紹 Hadoop 分布式文件系統(HDFS),第 4 章介紹分布式數據庫(HBase),第5章介紹NoSQL數據庫,第6章介紹云數據庫。
知識地圖
重點與難點
重點為掌握分布式文件系統和分布式數據庫的實現原理和應用方法。難點為理解HDFS的存儲原理、HBase的實現原理與運行機制。