- 數據挖掘(第2版)
- 王朝霞主編
- 957字
- 2023-12-13 16:00:56
第1版前言
21世紀初,人類邁入大數據時代,各行各業擁抱大數據,希冀借大數據挖掘與分析來促進產業升級與變革。因此,大數據人才的需求呈現井噴之勢。
中國云計算專家咨詢委員會秘書長劉鵬教授順勢而為,周密思考,提出高級大數據人才培養課程體系,并邀請全國上百家高校中從事一線教學科研任務的教師一起,編撰高級大數據人才培養叢書。本書即該套叢書之一。
本書的定位是大數據挖掘技術與應用。以“讓學習變得輕松”為根本出發點,本書努力回答:數據挖掘是什么?發展如何?經典的數據挖掘算法有哪些?大數據環境下數據挖掘有哪些新特點和新延展?如何分析實際問題,如何應用?本書編寫的指導思想有三:一是理論與應用相呼應。從數據挖掘算法理論與方法、工具和應用兩方面進行闡述,既注重理論,同時貼近實戰,希望學習者既能很快將理論應用于實際領域的數據分析中,也具備厚積薄發的能力。二是基礎與發展相配合。大數據新常態下經典數據挖掘的基本原理仍然適用,不同之處在于,根據現有分布式、并行環境,對原有算法進行優化。本書循序漸進地介紹經典數據挖掘算法,以及大數據環境下數據挖掘算法的新特點和新延展,有助于學習者全面掌握數據挖掘理論。三是局部與全局整體聯動。本書屬于高級大數據人才培養叢書系列教材,因此,在本書內容組織上,需要考慮與叢書其他教材的關系,既緊密聯系又自成一體,共同組成高級大數據人才培養課程體系。
基于上述指導思想,本書內容分為4部分:一是概念與基礎,見第1章緒論和第2章;二是經典的數據挖掘算法,見第3章分類、第4章回歸、第5章聚類和第6章關聯規則;三是大數據挖掘技術,其中,第7章重點介紹了大數據環境下經典數據挖掘算法的優化與改進,第8章介紹了推薦系統的理論與方法,第9章則對鏈接分析與網頁排序、互聯網信息抽取、日志挖掘與查詢分析等技術進行了介紹;四是常用數據挖掘工具(包),見附錄A和附錄B。
本書成稿過程中得到叢書主編劉鵬教授和金陵科技學院張燕副院長的大力支持,在書稿提綱和內容組織上提出了諸多建設性意見。同時,兩輪審稿評審專家對本書給予了全面指導和幫助,在此一并致謝。
當前,大數據挖掘技術仍處在高速發展的歷史階段,其概念內涵、技術方法、應用模式還在不斷創新演化之中,由于時間和作者水平所限,本書還存在缺點和不足,歡迎大家不吝賜教。
王朝霞
于陸軍勤務學院