- Scikit-learn機器學習詳解(上)
- 潘風文 潘啟儒
- 725字
- 2021-12-23 11:33:12
1.3 機器學習和數據挖掘
雖然數據挖掘(DM, Data Mining)這一術語在20世紀90年代才出現,但是數據挖掘所涉及的技術早在20世紀30年代已有所發展。隨著計算機技術和數據庫在各行各業得到廣泛應用,業務系統產生的數據量不斷膨脹,傳統的統計分析工具受到巨大的挑戰,導致企業級數據倉庫(DW,Data Warehouse)出現,數據倉庫的出現,預示著需要某種革命性的技術去挖掘大量數據背后的潛在價值。科學家和研究人員把當時最新的數據分析技術(例如關聯規則、神經網絡、決策樹等)與數據庫技術結合起來,用計算機嘗試挖掘基于數據庫存儲的大量業務數據背后的信息和知識,兩者的結合催生了數據庫知識發現(KDD, Knowledge Discovery in Databases)的誕生。1989年8月,在美國底特律召開的第11屆國際人工智能聯合會議(IJCAI-89)上,首次由Gregory PiatetskyShapiro提出了知識發現(KDD)這個概念,目前KDD的重點已經從發現方法轉向了實踐應用。
數據挖掘是KDD的核心,它是從大量數據中提取可信的、新穎的、有效的知識的處理過程,這些知識一般來說是隱含的、事先未知的有用信息,表現形式為概念、規則、模式和規律等。圖1-7展示了數據挖掘示意圖。
從數據挖掘和機器學習的發展歷史來看,兩者在起源、任務目標、實現技術等方面有眾多的不同,但是隨著大數據及人工智能技術的發展和應用,可以認為機器學習是數據挖掘的升級,兩者的區別越來越小,更多的是分工和融合。筆者認為,當前數據挖掘和機器學習的關系是業務應用和具體技術的關系,簡單來說,數據挖掘更多面向業務分析人員,屬于業務分析的范疇,是人工智能技術在業務分析中的重要應用;機器學習關注機器訓練,涉及自動提取信息和構建模型的算法研究,是人工智能技術發展的重要組成部分。二者是同一個問題的不同側面,和大數據技術一起,攜手共同解決業務問題,實現業務的智能化。

圖1-7 數據挖掘示意圖
- 嵌入式Linux開發實用教程(“十二五”國家重點圖書出版規劃項目)
- After Effects CS6影視后期制作與欄目包裝(微課版)
- 計算機應用基礎教程上機實踐(Windows 7+Office 2010)
- 教師職業生涯規劃與發展
- 保險基礎與實務(第2版)
- 真情的服務:中國石油礦區優秀服務案例匯編
- 抖音+剪映+Premiere短視頻創作實戰(全彩微課版)
- ADOBE ACROBAT XI標準培訓教材
- 化學品分類與鑒定
- 房地產金融
- 物流員(國家職業資格四級)考點難點歸納及預測試卷
- 駕考通關全套秘籍:駕校學車實用指南(全彩印刷·第2版)
- 中國新材料研究前沿報告2020
- 配電線路工基本技能(配網專業實訓技術叢書)
- AutoCAD 2015中文版基礎教程