- 精通Spark數(shù)據(jù)科學(xué)
- (美)安德魯·摩根 (英)安托萬·阿門德 大衛(wèi)·喬治 馬修·哈利特
- 280字
- 2021-01-15 16:45:31
內(nèi)容提要
Apache Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。這是一本專門介紹Spark的圖書,旨在教會讀者利用Spark構(gòu)建實(shí)用的數(shù)據(jù)科學(xué)解決方案。
本書內(nèi)容包括14章,由淺入深地介紹了數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)、數(shù)據(jù)獲取、輸入格式與模式、探索性數(shù)據(jù)分析、利用Spark進(jìn)行地理分析、采集基于鏈接的外部數(shù)據(jù)、構(gòu)建社區(qū)、構(gòu)建推薦系統(tǒng)、新聞詞典和實(shí)時標(biāo)記系統(tǒng)、故事除重和變遷、情感分析中的異常檢測、趨勢演算、數(shù)據(jù)保護(hù)和可擴(kuò)展算法。
本書適合數(shù)據(jù)科學(xué)家以及對數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)感興趣的讀者閱讀,需要讀者具備數(shù)據(jù)科學(xué)相關(guān)的基礎(chǔ)知識,并通過閱讀本書進(jìn)一步提升Spark運(yùn)用能力,從而創(chuàng)建出高效且實(shí)用的數(shù)據(jù)科學(xué)解決方案。
推薦閱讀
- 亮劍.NET:.NET深入體驗(yàn)與實(shí)戰(zhàn)精要
- Design for the Future
- Dreamweaver CS3網(wǎng)頁制作融會貫通
- Hands-On Machine Learning on Google Cloud Platform
- 計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用基礎(chǔ)
- Java Web整合開發(fā)全程指南
- 嵌入式操作系統(tǒng)
- Prometheus監(jiān)控實(shí)戰(zhàn)
- 項(xiàng)目管理成功利器Project 2007全程解析
- 工業(yè)機(jī)器人應(yīng)用案例集錦
- Flink原理與實(shí)踐
- Photoshop CS5圖像處理入門、進(jìn)階與提高
- Creating ELearning Games with Unity
- FreeCAD [How-to]
- ARM體系結(jié)構(gòu)與編程