- 精通Spark數據科學
- (美)安德魯·摩根 (英)安托萬·阿門德 大衛·喬治 馬修·哈利特
- 261字
- 2021-01-15 16:45:33
本書的排版約定
在本書中,讀者會發現一些不同的文本樣式被用來區別不同種類的信息,下面是一些示例及其各自的含義。
在文本、數據庫表名、文件夾名、文件名、文件擴展名、路徑名、虛擬URL、用戶輸入信息、Twitter條目等位置出現的代碼關鍵詞用這樣的方式展示:代碼的下一行讀取了鏈接,并將其分配給BeautifulSoup函數。
代碼塊的格式設置如下:
import org.apache.spark.sql.functions._
val rdd = rawDS map GdeltParser.toCaseClass
val ds = rdd.toDS()
// DataFrame-style API
ds.agg(avg("goldstein")).as("goldstein").show()
如果要吸引你注意代碼塊中的特定部分,相關的行或項目會被加粗:
spark.sql("SELECT V2GCAM FROM GKG LIMIT 5").show
spark.sql("SELECT AVG(GOLDSTEIN) AS GOLDSTEIN FROM GKG WHERE GOLDSTEIN IS
NOT NULL").show()
新詞和重要的關鍵詞會由加粗的字體顯示。
這里出現的是警告或者重要的注意點。
這里出現的是提示和技巧。