牛牛怎么压钱才赢

第1章序篇

Spark從2009年問世以來，就以星火燎原之勢迅速席卷業界。我還記得在2011年左右，在搜索引擎中輸入“Spark”的關鍵字，置頂結果是雪佛蘭的Spark汽車，而如今，Spark已經成了事實上的大數據處理的工業標準、技術棧和行業領先解決方案，不得不令人感嘆技術的日新月異。

目前Spark項目被托管在GitHub上，從GitHub上的統計來看，Spark無論是從Contributor還是從commit數量上來說，都可以說是最活躍的開源項目之一，如圖1-1和圖1-2所示。

圖1-1 Spark Contributor人數日益增加

圖1-2 Spark活躍度

Spark誕生于學界，成長于社區，它利用了開源社區的力量與文化，集中了世界上的一群天才們，夜以繼日地為Spark做出貢獻，這也是Spark發展迅速的原因之一。本章將介紹Spark的背景、生態圈以及思想，為本書后面的學習打下基礎。

本章包含以下內容：

● Spark與BDAS；

● Databricks；

● 如何用GitHub為Spark貢獻代碼；

● 函數式編程思想。