舉報

會員
Spark SQL入門與實踐指南
最新章節:
9.9 本章小結
SparkSQL是Spark大數據框架的一部分,支持使用標準SQL查詢和HiveQL來讀寫數據,可用于結構化數據處理,并可以執行類似SQL的Spark數據查詢,有助于開發人員更快地創建和運行Spark程序。全書分為4篇,共9章,第一篇講解了SparkSQL發展歷史和開發環境搭建。第二篇講解了SparkSQL實例,使得讀者掌握SparkSQL的入門操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各種操作。第三篇講解了基于WiFi探針的商業大數據分析項目,實例中包含數據采集、預處理、存儲、利用SparkSQL挖掘數據,一步一步帶領讀者學習SparkSQL強大的數據挖掘功能。第四篇講解了SparkSQL優化的知識。本書適合Spark初學者、Spark數據分析人員以及Spark程序開發人員,也適合高校和培訓學校相關專業的師生教學參考。
最新章節
- 9.9 本章小結
- 9.8 Spark SQL解析引擎Catalyst簡介
- 9.7 Spark執行引擎Tungsten簡介
- 9.6 解決數據傾斜問題
- 9.5 Spark調優七式
- 9.4 Spark編程四大守則
品牌:清華大學
上架時間:2019-12-06 15:10:58
出版社:清華大學出版社
本書數字版權由清華大學提供,并由其授權上海閱文信息技術有限公司制作發行