- 機器學習實戰:基于Scikit-Learn、Keras和TensorFlow(原書第3版)
- (法)奧雷利安·杰龍
- 692字
- 2024-09-11 17:32:58
第一部分 機器學習的基礎知識
第1章 機器學習概覽
不久前,如果你拿起手機問它回家的路,它會不理你,人們會質疑你的理智。但機器學習不再是科幻小說:每天都有數十億人在使用它。事實上,它已經在一些專業應用程序中存在了幾十年,例如光學字符識別(Optical Character Recognition,OCR)。第一個真正成為主流、改善數億人生活的ML應用程序在20世紀90年代風靡全球:垃圾郵件過濾器。它不完全是一個具有自我意識的機器人,但它在技術上確實稱得上是機器學習:它實際上學得非常好,以至于你很少需要再將電子郵件標記為垃圾郵件。緊隨其后的是數百個ML應用程序,它們現在悄悄地為你經常使用的數百種產品和功能提供支持:語音提示、自動翻譯、圖像搜索、產品推薦等。
機器學習從哪里開始,又在哪里結束呢?機器進行學習到底意味著什么?如果我下載了所有維基百科文章的副本,我的計算機就真的學會了什么嗎?它突然變聰明了嗎?在本章中,我將首先闡明什么是機器學習,以及你為什么想要使用它。
在我們開始探索機器學習大陸之前,我們先看一看地圖并了解這片大陸上的主要區域和最顯著的地標:監督學習與無監督學習及其變體、在線學習與批量學習、基于實例與基于模型的學習。然后,我們將了解典型機器學習項目的工作流程,討論你可能面臨的主要挑戰,并介紹如何評估和微調機器學習系統。
本章將介紹每個數據科學家都應該牢記的許多基本概念(和專業術語)。雖然本章是概述(這是唯一沒有太多代碼的一章),相對簡單,但我的目標是確保在我們繼續閱讀本書的其余部分之前,一切對你來說都是非常清楚的。所以喝杯咖啡,開始學習吧!
如果你已經熟悉機器學習基礎知識,你可以直接跳到第2章。如果你不確定,可以嘗試回答本章末尾列出的所有問題,然后再繼續。