官术网_书友最值得收藏!

1.4.4 高大上的統計編程技術

不知道讀者有沒有發現一個問題,那就是當你尋找數據分析相關的工作崗位時,基本上都會看見企業的任職要求中提到統計建模或數據挖掘方面的技能,同時也會附上應聘者應該掌握的某些統計軟件(如SPSS、SAS、Python、R等)。上述所提到的4款軟件,除了SPSS屬于“傻瓜式”統計工具(即菜單式統計工具,無須編程),其余的三種都屬于編程類統計工具。對于讀者而言,是否掌握其中某個或某些工具的使用,以及對這些工具的使用熟練度是否滿足企業的要求在求職過程和后續的工作中是非常重要的。

在日常工作中,比較常用的統計模型(或方法)包括數據的點估計、區間估計、方差分析、各種假設檢驗(如卡方檢驗、t檢驗、F檢驗、正態性檢驗等)、數據降維(如主成分分析、因子分析等);常用的數據挖掘模型包括預測類算法(如多元線性回歸模型、決策樹模型、隨機森林模型、K近鄰算法、支持向量機SVM模型等)、分類算法(如Logistic回歸模型、貝葉斯算法、提升樹GBDT算法等)以及聚類算法(如K均值聚類、層次聚類、密度聚類等)。在本書的第5章,將重點講解Python的使用,包括數據的讀取、清洗、整理以及統計模型的使用和線性回歸模型的實戰。利用Python構建模型的代碼截圖如圖1-28所示。

圖1-28 Python的操作界面

主站蜘蛛池模板: 高碑店市| 漳浦县| 阿荣旗| 自治县| 乐至县| 抚顺市| 林芝县| 广丰县| 济源市| 澜沧| 原平市| 武宣县| 武陟县| 宜宾市| 东至县| 鹤庆县| 利川市| 崇义县| 花莲市| 黄山市| 贵定县| 三门峡市| 志丹县| 鸡泽县| 和硕县| 白山市| 乐业县| 江油市| 灵丘县| 中超| 江门市| 疏附县| 闸北区| 曲阜市| 灌南县| 福清市| 垦利县| 舒城县| 孝义市| 长子县| 平凉市|