PySpark大數據分析與應用
本書以Python作為開發(fā)語言,系統(tǒng)介紹PySpark開發(fā)環(huán)境搭建流程及基于PySpark進行大數據分析的相關知識。本書條理清晰、重點突出,理論敘述循序漸進、由淺入深。本書共7章,第1?5章包括PySpark大數據分析概述、PySpark安裝配置、基于PySpark的DataFrame操作、基于PySpark的流式數據處理、基于PySpark的機器學習庫,內容介紹注重理論與實踐相結合,通過典型示例強化PySpark在大數據分析中的實際應用;第6、7章通過基于PySpark的網絡招聘信息的職業(yè)類型劃分和基于PySpark的信用貸款風險分析兩個完整的案例實戰(zhàn),結合前5章的PySpark編程知識,實現完整的大數據分析過程。本書大部分章包含實訓和課后習題,讀者通過練習和操作實踐,能夠鞏固所學的內容。本書可作為高校數據科學或大數據相關專業(yè)的教材,也可作為機器學習愛好者的自學用書。
·10.4萬字