舉報(bào)

會員
Spark SQL入門與實(shí)踐指南
最新章節(jié):
9.9 本章小結(jié)
SparkSQL是Spark大數(shù)據(jù)框架的一部分,支持使用標(biāo)準(zhǔn)SQL查詢和HiveQL來讀寫數(shù)據(jù),可用于結(jié)構(gòu)化數(shù)據(jù)處理,并可以執(zhí)行類似SQL的Spark數(shù)據(jù)查詢,有助于開發(fā)人員更快地創(chuàng)建和運(yùn)行Spark程序。全書分為4篇,共9章,第一篇講解了SparkSQL發(fā)展歷史和開發(fā)環(huán)境搭建。第二篇講解了SparkSQL實(shí)例,使得讀者掌握SparkSQL的入門操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各種操作。第三篇講解了基于WiFi探針的商業(yè)大數(shù)據(jù)分析項(xiàng)目,實(shí)例中包含數(shù)據(jù)采集、預(yù)處理、存儲、利用SparkSQL挖掘數(shù)據(jù),一步一步帶領(lǐng)讀者學(xué)習(xí)SparkSQL強(qiáng)大的數(shù)據(jù)挖掘功能。第四篇講解了SparkSQL優(yōu)化的知識。本書適合Spark初學(xué)者、Spark數(shù)據(jù)分析人員以及Spark程序開發(fā)人員,也適合高校和培訓(xùn)學(xué)校相關(guān)專業(yè)的師生教學(xué)參考。
目錄(60章)
倒序
- 封面
- 書名頁
- 版權(quán)信息
- 內(nèi)容簡介
- 作者簡介
- 前言
- 第一部分 入門篇
- 第1章 初識Spark SQL
- 1.1 Spark SQL的前世今生
- 1.2 Spark SQL能做什么
- 第2章 Spark安裝、編程環(huán)境搭建以及打包提交
- 2.1 Spark的簡易安裝
- 2.2 準(zhǔn)備編寫Spark應(yīng)用程序的IDEA環(huán)境
- 2.3 將編寫好的Spark應(yīng)用程序打包成jar提交到Spark上
- 第二部分 基礎(chǔ)篇
- 第3章 Spark上的RDD編程
- 3.1 RDD基礎(chǔ)
- 3.2 RDD簡單實(shí)例—wordcount
- 3.3 創(chuàng)建RDD
- 3.4 RDD操作
- 3.5 向Spark傳遞函數(shù)
- 3.6 常見的轉(zhuǎn)化操作和行動操作
- 3.7 深入理解RDD
- 3.8 RDD緩存、持久化
- 3.9 RDD checkpoint容錯(cuò)機(jī)制
- 第4章 Spark SQL編程入門
- 4.1 Spark SQL概述
- 4.2 Spark SQL編程入門示例
- 第5章 Spark SQL的DataFrame操作大全
- 5.1 由JSON文件生成所需的DataFrame對象
- 5.2 DataFrame上的行動操作
- 5.3 DataFrame上的轉(zhuǎn)化操作
- 第6章 Spark SQL支持的多種數(shù)據(jù)源
- 6.1 概述
- 6.2 典型結(jié)構(gòu)化數(shù)據(jù)源
- 第三部分 實(shí)踐篇
- 第7章 Spark SQL工程實(shí)戰(zhàn)之基于WiFi探針的商業(yè)大數(shù)據(jù)分析技術(shù)
- 7.1 功能需求
- 7.2 系統(tǒng)架構(gòu)
- 7.3 功能設(shè)計(jì)
- 7.4 數(shù)據(jù)庫結(jié)構(gòu)
- 7.5 本章小結(jié)
- 第8章 第一個(gè)Spark SQL應(yīng)用程序
- 8.1 完全分布式環(huán)境搭建
- 8.2 數(shù)據(jù)清洗
- 8.3 數(shù)據(jù)處理流程
- 8.4 Spark程序遠(yuǎn)程調(diào)試
- 8.5 Spark的Web界面
- 8.6 本章小結(jié)
- 第四部分 優(yōu)化篇
- 第9章 讓Spark程序再快一點(diǎn)
- 9.1 Spark執(zhí)行流程
- 9.2 Spark內(nèi)存簡介
- 9.3 Spark的一些概念
- 9.4 Spark編程四大守則
- 9.5 Spark調(diào)優(yōu)七式
- 9.6 解決數(shù)據(jù)傾斜問題
- 9.7 Spark執(zhí)行引擎Tungsten簡介
- 9.8 Spark SQL解析引擎Catalyst簡介
- 9.9 本章小結(jié) 更新時(shí)間:2019-12-06 16:38:46
推薦閱讀
- 高效能辦公必修課:Word圖文處理
- 空間機(jī)器人遙操作系統(tǒng)及控制
- 數(shù)據(jù)中心建設(shè)與管理指南
- Visual C# 2008開發(fā)技術(shù)實(shí)例詳解
- PyTorch深度學(xué)習(xí)實(shí)戰(zhàn)
- 機(jī)器人編程實(shí)戰(zhàn)
- 四向穿梭式自動化密集倉儲系統(tǒng)的設(shè)計(jì)與控制
- AutoCAD 2012中文版繪圖設(shè)計(jì)高手速成
- Docker High Performance(Second Edition)
- Machine Learning with Apache Spark Quick Start Guide
- 簡明學(xué)中文版Flash動畫制作
- Kubernetes on AWS
- ROS Robotics By Example(Second Edition)
- 人工智能基礎(chǔ)
- SolarWinds Server & Application Monitor:Deployment and Administration
- Flash CS3動畫制作融會貫通
- 時(shí)序大數(shù)據(jù)平臺TDengine核心原理與實(shí)戰(zhàn)
- 新手學(xué)Illustrator CS6平面廣告設(shè)計(jì)
- Linux應(yīng)用程序設(shè)計(jì)
- 中文版Photoshop CS6高手速成
- 數(shù)據(jù)結(jié)構(gòu)(C語言版)
- 操作系統(tǒng)及網(wǎng)絡(luò)應(yīng)用技術(shù)
- 物聯(lián)網(wǎng)應(yīng)用與解決方案
- 實(shí)時(shí)數(shù)據(jù)處理和分析指南
- PLC與步進(jìn)伺服快速入門與實(shí)踐
- 工廠數(shù)控仿真技術(shù)實(shí)例特訓(xùn)(Vericut 7.3版)
- Machine Learning with R
- KUKA工業(yè)機(jī)器人編程與實(shí)操技巧
- 深入淺出GAN生成對抗網(wǎng)絡(luò):原理剖析與TensorFlow實(shí)踐
- Flex 3開發(fā)實(shí)踐