- Python數據挖掘入門與實踐
- Robert Layton
- 352字
- 2020-01-10 15:40:59
1.6 小結
本章介紹了如何用Python進行數據挖掘。如果你能運行這一部分的代碼(見代碼包第1章的文件夾),說明開發環境已搭建好,后續章節的大部分代碼都能運行了。當然有些Python庫還沒裝,隨用隨裝就好。
我們用IPython Notebook運行了代碼,好處是能及時看到一小塊代碼的輸出。它功能強大,后面會繼續使用。
我們舉了一個簡單的親和性分析的例子,用它找出顧客經常一起購買的商品。這種探索性的分析方法用處很大,能幫助人們發現商業流程、某個環境或場景中的潛在規律。親和性分析可用在商業、醫療、人工智能等領域,說不定能這些領域帶來突破。
本章還通過OneR算法介紹了分類的應用。該算法尋找最佳的特征值用于分類,該特征值在訓練集中哪個類別中出現的次數最多,待預測數據就屬于哪個類別。
后續章節會擴展分類和親和性分析的概念,同時還會介紹scikit-learn庫以及它實現的一些數據挖掘算法。
推薦閱讀
- 嵌入式系統應用
- 永磁同步電動機變頻調速系統及其控制(第2版)
- Prometheus監控實戰
- SAP Business Intelligence Quick Start Guide
- Microsoft System Center Confi guration Manager
- 中國戰略性新興產業研究與發展·增材制造
- 計算機組網技術
- 案例解說Delphi典型控制應用
- 人工智能云平臺:原理、設計與應用
- 分布式Java應用
- Building Analytics Teams
- Kubernetes Design Patterns and Extensions
- Building Smart Drones with ESP8266 and Arduino
- 數據庫技術及應用
- ORACLE數據庫技術實用詳解