Spark MLlib機器學(xué)習(xí)實踐(第2版)
Spark作為新興的、應(yīng)用范圍最為廣泛的大數(shù)據(jù)處理開源框架引起了廣泛的關(guān)注,它吸引了大量程序設(shè)計和開發(fā)人員進行相關(guān)內(nèi)容的學(xué)習(xí)與開發(fā),其中MLlib是Spark框架使用的核心。本書是一本細(xì)致介紹SparkMLlib程序設(shè)計的圖書,入門簡單,示例豐富。本書分為13章,從Spark基礎(chǔ)安裝和配置開始,依次介紹MLlib程序設(shè)計基礎(chǔ)、MLlib的數(shù)據(jù)對象構(gòu)建、MLlib中RDD使用介紹,各種分類、聚類、回歸等數(shù)據(jù)處理方法,最后還通過一個完整的實例,回顧了前面的學(xué)習(xí)內(nèi)容,并通過代碼實現(xiàn)了一個完整的分析過程。本書理論內(nèi)容由淺而深,采取實例和理論相結(jié)合的方式,講解細(xì)致直觀,適合SparkMLlib初學(xué)者、大數(shù)據(jù)分析和挖掘人員,也適合高校和培訓(xùn)學(xué)習(xí)相關(guān)專業(yè)的師生教學(xué)參考。
·8.2萬字