官术网_书友最值得收藏!

第3章 分布式文件系統HDFS

大數據時代必須解決海量數據的高效存儲問題,為此,谷歌開發了分布式文件系統(Google File System,GFS),通過網絡實現文件在多臺機器上的分布式存儲,較好地滿足了大規模數據存儲的需求。Hadoop分布式文件系統(Hadoop Distributed File System,HDFS)是針對GFS的開源實現,它是 Hadoop 兩大核心組成部分之一,提供了在廉價服務器集群中進行大規模分布式文件存儲的能力。HDFS 具有很好的容錯能力,并且兼容廉價的硬件設備,因此可以以較低的成本利用現有機器實現大流量和大數據量的讀寫。

本章首先介紹分布式文件系統的基本概念、結構和設計需求,然后介紹HDFS,詳細闡述它的重要概念、體系結構、存儲原理和讀寫過程,最后介紹了一些HDFS編程實踐方面的知識。

主站蜘蛛池模板: 房山区| 新巴尔虎右旗| 伊吾县| 苍梧县| 黑龙江省| 余江县| 西平县| 夏邑县| 宿松县| 永丰县| 湘潭市| 潮安县| 宁蒗| 南澳县| 盐池县| 枣强县| 姜堰市| 项城市| 上栗县| 英山县| 淳化县| 葫芦岛市| 漳平市| 福鼎市| 章丘市| 集安市| 清原| 三都| 伊吾县| 河北省| 新津县| 新巴尔虎右旗| 竹溪县| 宁强县| 泸溪县| 抚顺县| 汕头市| 汕尾市| 三穗县| 兴海县| 广昌县|