官术网_书友最值得收藏!

1.4.4 高大上的統計編程技術

不知道讀者有沒有發現一個問題,那就是當你尋找數據分析相關的工作崗位時,基本上都會看見企業的任職要求中提到統計建模或數據挖掘方面的技能,同時也會附上應聘者應該掌握的某些統計軟件(如SPSS、SAS、Python、R等)。上述所提到的4款軟件,除了SPSS屬于“傻瓜式”統計工具(即菜單式統計工具,無須編程),其余的三種都屬于編程類統計工具。對于讀者而言,是否掌握其中某個或某些工具的使用,以及對這些工具的使用熟練度是否滿足企業的要求在求職過程和后續的工作中是非常重要的。

在日常工作中,比較常用的統計模型(或方法)包括數據的點估計、區間估計、方差分析、各種假設檢驗(如卡方檢驗、t檢驗、F檢驗、正態性檢驗等)、數據降維(如主成分分析、因子分析等);常用的數據挖掘模型包括預測類算法(如多元線性回歸模型、決策樹模型、隨機森林模型、K近鄰算法、支持向量機SVM模型等)、分類算法(如Logistic回歸模型、貝葉斯算法、提升樹GBDT算法等)以及聚類算法(如K均值聚類、層次聚類、密度聚類等)。在本書的第5章,將重點講解Python的使用,包括數據的讀取、清洗、整理以及統計模型的使用和線性回歸模型的實戰。利用Python構建模型的代碼截圖如圖1-28所示。

圖1-28 Python的操作界面

主站蜘蛛池模板: 平谷区| 胶南市| 和田县| 靖西县| 左权县| 象山县| 贺州市| 凤山市| 闽清县| 天等县| 襄垣县| 安新县| 葫芦岛市| 江川县| 丰县| 星子县| 康马县| 哈巴河县| 城步| 化隆| 本溪市| 钟祥市| 汨罗市| 会宁县| 抚松县| 渑池县| 海宁市| 平舆县| 瑞安市| 义乌市| 麻阳| 涟源市| 长兴县| 时尚| 岳阳市| 辛集市| 黔西县| 宁波市| 甘孜县| 阿克| 博兴县|