- 機(jī)器學(xué)習(xí)從入門到入職:用sklearn與keras搭建人工智能模型
- 張威
- 318字
- 2020-05-22 17:14:10
第4章 Sklearn之?dāng)?shù)據(jù)預(yù)處理
數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個(gè)上限而已。顧名思義,特征工程的本質(zhì)是一項(xiàng)工程活動(dòng),目的是最大限度地從原始數(shù)據(jù)中提取特征以供算法和模型使用。數(shù)據(jù)預(yù)處理作為特征工程中的一個(gè)主要部分,我們有必要先對(duì)其進(jìn)行了解。
本章將根據(jù)機(jī)器學(xué)習(xí)的模型開發(fā)流程最初始的步驟——數(shù)據(jù)預(yù)處理進(jìn)行詳細(xì)介紹。簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)預(yù)處理就是將原始數(shù)據(jù)轉(zhuǎn)化為便于機(jī)器學(xué)習(xí)模型學(xué)習(xí)的數(shù)據(jù)。但在實(shí)際生活場(chǎng)景中,文本及圖像等非數(shù)字?jǐn)?shù)據(jù)應(yīng)當(dāng)如何處理?數(shù)據(jù)本身的結(jié)構(gòu)問(wèn)題(如缺失、取值范圍過(guò)大、結(jié)構(gòu)不平衡等問(wèn)題)又該如何解決?
通過(guò)學(xué)習(xí)本章,讀者可以了解以下幾方面內(nèi)容。
·數(shù)據(jù)預(yù)處理的種類;
·數(shù)據(jù)預(yù)處理的常用方法及場(chǎng)景;
·用Sklearn如何實(shí)現(xiàn)數(shù)據(jù)預(yù)處理。
推薦閱讀
- 自動(dòng)控制工程設(shè)計(jì)入門
- 過(guò)程控制工程及仿真
- Hands-On Cybersecurity with Blockchain
- Spark大數(shù)據(jù)技術(shù)與應(yīng)用
- Cloudera Administration Handbook
- 走近大數(shù)據(jù)
- 所羅門的密碼
- 智慧未來(lái)
- Red Hat Enterprise Linux 5.0服務(wù)器構(gòu)建與故障排除
- 機(jī)器人剛?cè)狁詈蟿?dòng)力學(xué)
- Java求職寶典
- 數(shù)據(jù)結(jié)構(gòu)與實(shí)訓(xùn)
- 單片機(jī)與微機(jī)原理及應(yīng)用
- 我的IT世界
- ASP.NET 4.0 MVC敏捷開發(fā)給力起飛