- Python數據分析與挖掘
- 齊福利 楊玲主編
- 861字
- 2024-03-14 11:21:30
前言
數據分析是“沙里淘金”,是從大量的數據中獲得有價值的知識,而信息社會的數據量正在膨脹,亟須我們從蕪雜的數據中淘出社會需要的“真金”,這已經成為人們的共識。無論是國家政府部門、企事業單位,還是個人,數據分析工作都是進行決策之前的重要環節,數據分析工作質量的好壞直接決定著決策的成敗。數據分析不僅被應用于經濟發展的各個領域,也被應用于人們的日常工作,人們的工作離開數據分析便無法達到滿意的效果甚至會導致嚴重的失誤。數據分析的工具、方法有很多,但比較通用且能顯示分析人員水平、比較靈活且具有提升空間的莫過于Python數據處理與分析。
Python是“膠水語言”,它的強大之處在于其融入了眾多模塊。Python語言在數據處理和人工智能上大放異彩,也在于其相應模塊具有很大優勢。而Python的每一個模塊無疑又是一個小的語言體系,這給學生掌握Python數據分析與處理知識增加了負擔。有鑒于此,本書采用模塊化組織方式,依據Python數據處理與分析的要求組織教學。模塊又稱擴展庫,Python數據分析的主要模塊包括重在數值計算、對超大數組進行快速處理的科學計算基礎庫NumPy,以及以NumPy為基礎架構的數據分析包pandas;JSON格式在互聯網時代應用廣泛,JSON模塊則支持JSON格式與Python對象的轉換;數據分析需要讀/寫數據庫,本書專門介紹了pymysql模塊的使用方法;可視化是數據分析最重要的一環,本書分別介紹了模塊Matplotlib、Flask框架與ECharts;數據挖掘則聚焦機器學習,本書特別介紹了sklearn模塊各種算法模型的訓練與應用。
本書面向大數據應用型人才,使用Python 3.6.5版本,采用流行的PyCharm IDE開發環境。本書是數據分析、挖掘的綜合與深入應用,在學習本書之前讀者應熟練掌握Python的基本語句和函數、MySQL數據庫的基本操作以及SQL語句的編寫方法。本書對Python數據分析模塊的語句知識點進行了案例介紹,以“動動手練習”的形式提高讀者的編程技能。編者近幾年一直從事數據分析教學,并帶領學生參加各種大數據競賽,將積累了多年的Python開發經驗編寫成書,希望能對更多的同行和學生有所助益。
在此特別感謝王永恒、王子、劉婷婷、劉敏老師參與本書的編寫,他們的專業知識和研究成果為本書的順利出版起到至關重要的作用。
編者
2023年9月