- 數據分析從入門到進階
- 陳紅波 劉順祥等
- 506字
- 2019-11-12 14:03:55
1.4.4 高大上的統計編程技術
不知道讀者有沒有發現一個問題,那就是當你尋找數據分析相關的工作崗位時,基本上都會看見企業的任職要求中提到統計建模或數據挖掘方面的技能,同時也會附上應聘者應該掌握的某些統計軟件(如SPSS、SAS、Python、R等)。上述所提到的4款軟件,除了SPSS屬于“傻瓜式”統計工具(即菜單式統計工具,無須編程),其余的三種都屬于編程類統計工具。對于讀者而言,是否掌握其中某個或某些工具的使用,以及對這些工具的使用熟練度是否滿足企業的要求在求職過程和后續的工作中是非常重要的。
在日常工作中,比較常用的統計模型(或方法)包括數據的點估計、區間估計、方差分析、各種假設檢驗(如卡方檢驗、t檢驗、F檢驗、正態性檢驗等)、數據降維(如主成分分析、因子分析等);常用的數據挖掘模型包括預測類算法(如多元線性回歸模型、決策樹模型、隨機森林模型、K近鄰算法、支持向量機SVM模型等)、分類算法(如Logistic回歸模型、貝葉斯算法、提升樹GBDT算法等)以及聚類算法(如K均值聚類、層次聚類、密度聚類等)。在本書的第5章,將重點講解Python的使用,包括數據的讀取、清洗、整理以及統計模型的使用和線性回歸模型的實戰。利用Python構建模型的代碼截圖如圖1-28所示。

圖1-28 Python的操作界面
推薦閱讀
- LaTeX Cookbook
- Docker and Kubernetes for Java Developers
- Visual FoxPro程序設計教程(第3版)
- 程序設計與實踐(VB.NET)
- Vue.js 3.0源碼解析(微課視頻版)
- Java Web應用開發技術與案例教程(第2版)
- 從0到1:Python數據分析
- ASP.NET程序開發范例寶典
- GitHub入門與實踐
- Java Web開發實例大全(基礎卷) (軟件工程師開發大系)
- HTML+CSS+JavaScript網頁制作:從入門到精通(第4版)
- Learning D
- Java RESTful Web Service實戰
- Python編程入門(第3版)
- Kotlin程序員面試算法寶典