- 移動端AI與ML應用開發:基于iOS和Android
- (美)勞倫斯·莫羅尼
- 542字
- 2023-07-24 18:05:21
第2章 計算機視覺簡介
雖然本書的目的不是教你構建和訓練機器學習模型的所有基礎知識,但我確實想涵蓋一些基本場景,以便本書仍然可以獨立使用。如果你想了解更多關于使用TensorFlow的模型創建過程,我推薦我的書籍AI and Machine Learning for Coders(由O'Reilly出版),如果你想深入探究,那么Aurélien Géron的優秀著作《機器學習實戰:基于Scikit-Learn、Keras和TensorFlow》一書是必需的!
在本章中,我們將越過你在第1章創建的非常基本的模型,查看兩個更復雜的模型,你將在其中處理計算機視覺——計算機如何“看到”對象。與術語“人工智能”和“機器學習”類似,短語“計算機視覺”和“看”可能會導致人們誤解模型的基本原理。
計算機視覺是一個巨大的研究領域,本章我們將重點關注幾個核心場景,我們將使用技術來解析圖像的內容,或者標記圖像的主要內容,或者在圖像中查找物體。
它并不是真正的“視覺”或“看”,而是更多的結構化算法,允許計算機解析圖像的像素。它不會“理解”圖像,就像它將單詞解析為單個字符串時理解句子的含義一樣!
如果我們嘗試使用傳統的基于規則的方法來完成這項任務,即使是最簡單的圖像,我們最終也會有很多代碼行。機器學習是這里的關鍵參與者,正如你在本章中看到的,通過使用我們在第1章用到的相同代碼模式,更深入一點,我們可以創建解析圖像內容的模型……只需幾行代碼。讓我們開始吧。