- 大數據基礎與應用
- 趙國生 王健 宋一兵主編
- 318字
- 2021-12-15 16:00:23
2.1 Hadoop簡介
中國進入大數據風起云涌的時代,而以Hadoop為代表的一系列軟件占據大數據處理的地盤。Hadoop也從小眾領域,變成了大數據開發的標準之一,甚至在Hadoop原有技術基礎之上,出現了Hadoop家族產品。Hadoop在大數據技術體系中的地位至關重要,可以說Hadoop是大數據技術的基礎,要想在大數據技術道路上越走越遠,必須扎實掌握Hadoop基礎知識。
Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。用戶可以在不了解分布式底層細節的情況下,開發分布式程序,能夠十分便利地利用集群的強大能力進行程序運算,解決高可用問題。
Hadoop框架最核心的設計就是:HDFS和MapReduce。Hadoop實現了一個分布式文件系統(Hadoop Distributed File System,HDFS)。HDFS有高容錯性特點,并且設計用來部署在低廉的硬件上。它為海量的數據提供了存儲,而MapReduce為海量的數據提供了計算。
推薦閱讀
- 表面處理技術概論(第二版)
- 智慧城市建設:大數據分析、信息技術(ICT)與設計思維
- 2020年青海省軍轉干部安置考試《行政職業能力測驗》題庫【真題精選+章節題庫+模擬試題】
- IT創新創業六講(第2版)
- 青島理工大學商學院436資產評估專業基礎[專業碩士]歷年考研真題及詳解
- 浙江工商大學外國語學院357英語翻譯基礎[專業碩士]歷年考研真題及詳解
- 人文地理學野外實習方法指導與案例研究
- 2020年貴州省選聘大學生村官考試《公共基礎知識》題庫【真題精選+章節題庫+模擬試題】
- 材料清潔生產與循環經濟
- 重金屬鉻堆存場地土壤-地下水污染控制與修復
- 研究生英語學位課統考知識要點精解
- 薛榮久《國際貿易》(第6版)筆記和課后習題(含考研真題)詳解
- 羅斯《公司理財》(第9版)筆記和課后習題(含考研真題)詳解[視頻講解]
- 男裝產品開發(第2版)
- Access數據庫與VBA面向對象程序設計