官术网_书友最值得收藏!

第1章 序篇

Spark從2009年問世以來,就以星火燎原之勢迅速席卷業界。我還記得在2011年左右,在搜索引擎中輸入“Spark”的關鍵字,置頂結果是雪佛蘭的Spark汽車,而如今,Spark已經成了事實上的大數據處理的工業標準、技術棧和行業領先解決方案,不得不令人感嘆技術的日新月異。

目前Spark項目被托管在GitHub上,從GitHub上的統計來看,Spark無論是從Contributor還是從commit數量上來說,都可以說是最活躍的開源項目之一,如圖1-1和圖1-2所示。

圖1-1 Spark Contributor人數日益增加

圖1-2 Spark活躍度

Spark誕生于學界,成長于社區,它利用了開源社區的力量與文化,集中了世界上的一群天才們,夜以繼日地為Spark做出貢獻,這也是Spark發展迅速的原因之一。本章將介紹Spark的背景、生態圈以及思想,為本書后面的學習打下基礎。

本章包含以下內容:

● Spark與BDAS;

● Databricks;

● 如何用GitHub為Spark貢獻代碼;

● 函數式編程思想。

主站蜘蛛池模板: 万源市| 嘉定区| 周口市| 万盛区| 桂东县| 宿州市| 铁岭县| 河西区| 仁寿县| 佳木斯市| 中江县| 新晃| 永嘉县| 泌阳县| 芒康县| 清流县| 柞水县| 沙湾县| 察隅县| 安达市| 淳安县| 乐陵市| 仲巴县| 汶上县| 罗平县| 河津市| 衡东县| 揭西县| 霍邱县| 永善县| 张家界市| 湛江市| 马关县| 德安县| 陆川县| 新建县| 溧水县| 陕西省| 南平市| 武功县| 孙吴县|