官术网_书友最值得收藏!

內(nèi)容提要

Apache Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。這是一本專門介紹Spark的圖書,旨在教會讀者利用Spark構(gòu)建實(shí)用的數(shù)據(jù)科學(xué)解決方案。

本書內(nèi)容包括14章,由淺入深地介紹了數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)、數(shù)據(jù)獲取、輸入格式與模式、探索性數(shù)據(jù)分析、利用Spark進(jìn)行地理分析、采集基于鏈接的外部數(shù)據(jù)、構(gòu)建社區(qū)、構(gòu)建推薦系統(tǒng)、新聞詞典和實(shí)時標(biāo)記系統(tǒng)、故事除重和變遷、情感分析中的異常檢測、趨勢演算、數(shù)據(jù)保護(hù)和可擴(kuò)展算法。

本書適合數(shù)據(jù)科學(xué)家以及對數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)感興趣的讀者閱讀,需要讀者具備數(shù)據(jù)科學(xué)相關(guān)的基礎(chǔ)知識,并通過閱讀本書進(jìn)一步提升Spark運(yùn)用能力,從而創(chuàng)建出高效且實(shí)用的數(shù)據(jù)科學(xué)解決方案。

主站蜘蛛池模板: 乌兰县| 湘潭县| 绥宁县| 洮南市| 兰州市| 霞浦县| 青岛市| 澄城县| 航空| 望奎县| 鄱阳县| 醴陵市| 内乡县| 会理县| 囊谦县| 漾濞| 布尔津县| 无为县| 增城市| 丽水市| 新巴尔虎左旗| 星座| 丘北县| 新余市| 基隆市| 安陆市| 武清区| 湘潭县| 房产| 西畴县| 宣化县| 亚东县| 闽清县| 甘肃省| 东台市| 蒙自县| 陆丰市| 定兴县| 延津县| 习水县| 邢台县|