書名: Spark海量數據處理:技術詳解與平臺實戰作者名: 范東來本章字數: 334字更新時間: 2020-02-14 17:55:31
第1章 序篇
Spark從2009年問世以來,就以星火燎原之勢迅速席卷業界。我還記得在2011年左右,在搜索引擎中輸入“Spark”的關鍵字,置頂結果是雪佛蘭的Spark汽車,而如今,Spark已經成了事實上的大數據處理的工業標準、技術棧和行業領先解決方案,不得不令人感嘆技術的日新月異。
目前Spark項目被托管在GitHub上,從GitHub上的統計來看,Spark無論是從Contributor還是從commit數量上來說,都可以說是最活躍的開源項目之一,如圖1-1和圖1-2所示。

圖1-1 Spark Contributor人數日益增加

圖1-2 Spark活躍度
Spark誕生于學界,成長于社區,它利用了開源社區的力量與文化,集中了世界上的一群天才們,夜以繼日地為Spark做出貢獻,這也是Spark發展迅速的原因之一。本章將介紹Spark的背景、生態圈以及思想,為本書后面的學習打下基礎。
本章包含以下內容:
● Spark與BDAS;
● Databricks;
● 如何用GitHub為Spark貢獻代碼;
● 函數式編程思想。
推薦閱讀
- Dreamweaver CS3 Ajax網頁設計入門與實例詳解
- PPT,要你好看
- 玩轉智能機器人程小奔
- PowerShell 3.0 Advanced Administration Handbook
- Dreamweaver CS3網頁制作融會貫通
- Hands-On Machine Learning on Google Cloud Platform
- Effective DevOps with AWS
- Security Automation with Ansible 2
- 大數據技術入門(第2版)
- Google App Inventor
- 網絡組建與互聯
- Enterprise PowerShell Scripting Bootcamp
- Docker on Amazon Web Services
- Dreamweaver CS6精彩網頁制作與網站建設
- Salesforce Advanced Administrator Certification Guide