- 機器學習:使用OpenCV、Python和scikit-learn進行智能圖像處理(原書第2版)
- (印)阿迪蒂亞·夏爾馬 維什韋什·拉維·什里馬利 (美)邁克爾·貝耶勒
- 521字
- 2020-11-24 18:13:03
4.2 理解特征工程
不管你是否相信,一個機器學習系統的學習效果都主要取決于訓練數據的質量。盡管每種學習算法都有其優點和缺點,但是性能的差異往往取決于數據準備或者數據表示的方式。因此,可以把特征工程理解為數據表示的一種工具。機器學習算法試圖從樣本數據中學習問題的解決方案,而特征工程會問:用于學習問題的解決方案的樣本數據的最佳表示是什么?
是否還記得,在前面我們討論過一個完整的機器學習管道。在那里我們提及過特征提取,但是還有沒有真正討論其究竟是什么。讓我們來看看特征提取是如何融入機器學習管道的,見圖4-1。

圖4-1 特征提取與機器學習過程
簡單提示一下,我們已經討論過,特征工程可以分為兩個階段:
- 特征選擇(Feature selection):這是識別數據中重要屬性(或者特征)的過程。一張圖像的特征可能是邊緣、角點或脊的位置。在這一章,我們將研究OpenCV提供的一些更高級的特征描述符,例如二值魯棒獨立基本特征(Binary Robust Independent Elementary Feature,BRIEF)以及面向FAST和可旋轉的BRIEF(Oriented FAST and Rotated BRIEF,ORB)。
- 特征提取(Feature extraction):這實際上是將原始數據變換到期望特征空間以滿足機器學習算法的過程,如圖4-1所示。例如Harris操作符,它允許我們提取一張圖像中的角點(即一個選擇的特征)。
剩下要做的就是逐步介紹這些過程,并討論一些最常見的數據預處理技術。
推薦閱讀
- 剪映:剪輯+調色+字幕+配音+特效從新手到高手
- Vlog短視頻拍攝與剪輯從入門到精通
- 視頻拍攝與剪映剪輯技巧大全
- 視頻拍攝與制作:短視頻 商品視頻 直播視頻(第2版·全彩慕課版)
- Illustrator CS5圖形設計入門、進階與提高
- 抖音電商從入門到精通:爆款商品視頻剪輯
- 動靜之美:Sketch移動UI與交互動效設計詳解
- Illustrator CS4實戰教程(產品設計與制作)
- CG影視特效制作揭秘
- Maya動畫制作案例教程
- Photoshop CS6摳圖從新手到高手
- 新手易學:Photoshop CS5圖像處理
- Unity 3D 完全自學教程
- 漫畫江山:Q版角色設計與漫畫制作
- 精通HTML+CSS:100%網頁設計與布局密碼