- 機器學習:使用OpenCV、Python和scikit-learn進行智能圖像處理(原書第2版)
- (印)阿迪蒂亞·夏爾馬 維什韋什·拉維·什里馬利 (美)邁克爾·貝耶勒
- 420字
- 2020-11-24 18:13:03
第4章 數據表示和特征工程
在第3章中,我們建立了第一個監督學習模型,并將其應用于一些像Iris和Boston這樣的經典數據集。但是,在現實世界中,作為預封裝數據庫一部分的數據很少以簡潔的<n_samples x n_features>特征矩陣的形式出現。我們的任務是找到一種有意義的方式表示數據。尋找表示數據最優方法的過程稱為特征工程(feature engineering),這是數據科學家和機器學習實踐者試圖解決實際問題的主要任務之一。
我知道你更愿意跳到最后去建立人們見過的最深神經網絡。但是,請相信我,特征工程這個內容很重要!用正確的方式表示我們的數據比我們選擇精確的參數對監督模型性能的影響更大。我們也可以開始創造自己的特征了。因此,在這一章,我們將回顧一些常見的特征工程任務。我們將要介紹預處理、縮放技術以及降維。我們還將學習表示類別變量、文本特征以及圖像。
本章將介紹以下主題:
- 一學就會的常見預處理技術。
- 中心縮放及多維縮放。
- 類別變量的表示。
- 使用PCA之類的技術對數據降維。
- 文本特征的表示。
- 學習圖像編碼的最佳方法。
讓我們從頭開始介紹吧!
推薦閱讀
- 水晶石技法3ds Max建筑模型技術手冊
- 超好玩的電子制作:少兒電子制作啟蒙
- 基于BIM的Revit建筑與結構設計實踐一本通
- 3ds Max-After Effects電視頻道包裝全解析
- 新娘 Photoshop數碼影樓美工生存寶典
- 影視特效鏡頭跟蹤技術精粹(第2版)
- Premiere Pro 2020實用教程
- Photoshop CS6中文版完全學習手冊
- Final Cut Pro X影視包裝剪輯完全自學教程
- Adobe Flash CS5 ActionScript 3.0中文版經典教程
- iLike職場數碼照片修飾處理完美實現
- 手機短視頻制作從新手到高手
- TVart技法Maya/After Effects/Photoshop電視包裝經典案例解析
- Photoshop+Lightroom數碼攝影后期處理完全手冊
- 電腦繪畫:從入門到精通