- 大數據分析:數據倉庫項目實戰
- 尚硅谷IT教育編著
- 1089字
- 2021-01-05 18:09:52
1.3 學前導讀
在開始學習之前,希望讀者仔細閱讀以下內容,便于打開大數據學習之門。
1.3.1 學習的基礎要求
在學習本書之前,讀者需要提前了解一些基礎知識,有助于更加輕松、快速地掌握大數據的相關內容,在后續項目的搭建過程中能更加得心應手,為深入學習大數據打下堅實的基礎。
首先,學習大數據技術,讀者一定要掌握一個操作大數據技術的利器,這個利器就是一門編程語言,如Java、Scala、Python、R等。本書以Java為基礎進行編寫,所以學習本書需要讀者具備一定的Java基礎知識和Java編程經驗。
其次,讀者還需要掌握一些數據庫知識,如MySQL、Oracle等,并熟練使用SQL,本書將出現大量的SQL操作。
最后,讀者還需要掌握一門操作系統技術,即在服務器領域占主導地位的Linux,只要能夠熟練使用Linux的常用系統命令、文件操作命令和一些基本的Linux Shell編程即可。大數據系統需要處理業務系統服務器產生的海量日志數據信息,這些數據通常存儲在服務器端,各大互聯網公司常用的操作系統是在實際工作中安全性和穩定性很高的Linux或者UNIX。大數據生態圈的各框架組件也普遍運行在Linux上。
如果讀者不具備上述基礎知識,可以關注尚硅谷教育公眾號獲取學習資料,讀者可根據自身需要選擇相應課程進行學習。本書所講解的項目同時提供了視頻課程資料,包括尚硅谷大數據的各種學習視頻,讀者可在尚硅谷教育公眾號回復“數倉項目”免費獲取。
1.3.2 你將學到什么
本書將帶領讀者完成一個完整的數據倉庫搭建及需求實現項目,大致可以劃分為3部分:數據倉庫概論及項目需求描述、項目框架搭建和項目需求實現。
在項目需求及框架講解部分,讀者可以全面了解一個數據倉庫項目的具體需求,以及根據需求如何完成框架選型的過程。
在項目框架搭建部分,讀者將跟隨本書從操作系統開始,一步步搭建自己的虛擬機系統,了解各框架的基本知識,完成各框架的基本配置,最終形成一個可以正常運行的大數據虛擬機系統。
在項目需求實現部分,本書將從用戶行為數據采集模塊、業務數據采集模塊、數據倉庫搭建模塊、即席查詢模塊、元數據管理模塊5個方面對需求進行實現,讀者通過本部分的學習將會了解一個完整的數據倉庫系統從數據源到數據的最終展示是如何實現的,同時還能學到數據倉庫相關的理論知識,掌握Hive、Sqoop、Flume等日志數據采集工具的工作原理及應用方法。本部分對電商數據倉庫的常見實戰指標及難點實戰指標進行了透徹講解,具體指標包括每日、每周、每月活躍設備明細,留存用戶比例,沉默用戶、回流用戶、流失用戶統計,最近連續3周活躍用戶統計,最近7天內連續3天活躍用戶統計等。
通過對數據倉庫系統的學習,讀者能夠對數據倉庫項目建立起清晰、明確的概念,系統、全面地掌握各項數據倉庫項目技術,輕松應對各種數據倉庫的難題。
- 數據存儲架構與技術
- Mastering Machine Learning with R(Second Edition)
- The Game Jam Survival Guide
- 大數據架構商業之路:從業務需求到技術方案
- 信息學競賽寶典:數據結構基礎
- Mastering LOB Development for Silverlight 5:A Case Study in Action
- 量化投資:交易模型開發與數據挖掘
- 數據分析方法及應用:基于SPSS和EXCEL環境
- Tableau商業分析從新手到高手(視頻版)
- Learning Libgdx Game Development
- Working with OpenERP
- 工業大數據工程:系統、方法與實踐
- Hadoop與大數據挖掘
- 機器視覺原理與案例詳解
- Learning Game AI Programming with Lua