官术网_书友最值得收藏!

第3章 分布式文件系統(tǒng)HDFS

大數(shù)據(jù)時代必須解決海量數(shù)據(jù)的高效存儲問題,為此,Google開發(fā)了分布式文件系統(tǒng)(Google File System,GFS),通過網(wǎng)絡實現(xiàn)文件在多臺機器上的分布式存儲,較好地滿足了大規(guī)模數(shù)據(jù)存儲的需求。Hadoop分布式文件系統(tǒng)HDFS是針對GFS的開源實現(xiàn),它是Hadoop兩大核心部分之一,提供了在廉價服務器集群中進行大規(guī)模分布式文件存儲的能力。HDFS具有很好的容錯能力,并且兼容廉價的硬件設備,因此,可以以較低的成本,利用現(xiàn)有機器實現(xiàn)大流量和大數(shù)據(jù)量的讀寫工作。

本章首先介紹分布式文件系統(tǒng)的基本概念、結(jié)構(gòu)和設計需求,然后介紹HDFS,詳細闡述它的重要概念、體系結(jié)構(gòu)、存儲原理和讀寫過程,最后介紹一些HDFS編程實踐方面的知識。

主站蜘蛛池模板: 山东省| 葫芦岛市| 北流市| 应城市| 越西县| 盈江县| 吴旗县| 施秉县| 昭通市| 海阳市| 兰溪市| 木里| 弥勒县| 肃宁县| 灵台县| 六枝特区| 通海县| 敦化市| 康保县| 安宁市| 泰和县| 会泽县| 镇坪县| 高唐县| 昌平区| 漳浦县| 普安县| 枞阳县| 兴国县| 会理县| 白水县| 南涧| 陈巴尔虎旗| 广宗县| 嵊州市| 南京市| 鄢陵县| 金塔县| 伊吾县| 寻甸| 鄯善县|