官术网_书友最值得收藏!

第2章 數(shù)據(jù)預(yù)處理

工業(yè)分析通常需要融合多個領(lǐng)域的原始數(shù)據(jù),在進入機器學(xué)習(xí)算法之前,需要對數(shù)據(jù)進行預(yù)處理,包括數(shù)據(jù)清洗、數(shù)據(jù)合并、特征變量的提取與選擇等。這通常是一個反復(fù)迭代的過程,借助探索型數(shù)據(jù)分析(Exploratory Data Analysis,EDA)工具,通過數(shù)據(jù)的業(yè)務(wù)化、業(yè)務(wù)的數(shù)據(jù)化的迭代加深對數(shù)據(jù)的理解。本章簡要介紹數(shù)據(jù)預(yù)處理中各個算法工具,幫助讀者建立起整體的概念框架。

主站蜘蛛池模板: 东兰县| 堆龙德庆县| 江西省| 浦东新区| 祁门县| 修文县| 柞水县| 巩留县| 定州市| 秦皇岛市| 杂多县| 米泉市| 城固县| 宁德市| 岗巴县| 正阳县| 泰州市| 彝良县| 金乡县| 尤溪县| 丹巴县| 南通市| 神木县| 常德市| 广昌县| 庆云县| 株洲县| 玉龙| 红安县| 习水县| 宜兴市| 洛隆县| 沂水县| 新竹市| 邵武市| 榆树市| 左云县| 南郑县| 临泽县| 金山区| 长阳|