官术网_书友最值得收藏!

2.1 人工智能、機器學習與深度學習

近年來,深度學習的概念十分火熱,人工智能也由于這一技術的興起吸引了越來越多的關注。我們將結合一些基本的用例,簡要介紹一下這個新的技術。

首先需要明確人工智能、機器學習以及深度學習三者之間的關系,如圖2-1所示。如NVIDIA官網文章所述,人工智能是一個非常大的概念,而機器學習只是人工智能的一種實現方法。深度學習同樣也是一種實現機器學習的方法,是在機器學習的基礎上建立起來的。首先,從字面上看,二者都是在“學習”,因此在評價深度學習訓練出的模型好壞時,同樣直接來源于機器學習的評價方法。其次,深度學習最基本的形式是深度神經網絡,直接脫胎于機器學習中的神經網絡模型。

圖2-1 人工智能、機器學習以及深度學習三者之間的關系

(圖片來源:https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/)

正是由于深度學習直接脫胎于機器學習理論,因此本書將首先介紹一些基本的機器學習知識。機器學習本身包含了很多內容,如果對其進行簡單的分類梳理,可以歸于以下幾類:

  • 非監督學習
    •  聚類
    •  降維
    •  ...
  • 監督學習
    •  回歸問題
    •  分類問題

單純講概念,可能看起來有些枯燥,我們不妨把機器學習和人類的學習行為類比一下。監督學習相比非監督學習最大的區別是,這種方法有明確的評價指標,這種指標類似學校里的考試成績,我們可以簡單地認為考試成績高,這個學生就是好學生。對于機器而言,就是機器訓練的模型在給定的數據集中,預測準確率高,這個模型就是一個好模型。因此我們不妨認為監督學習就是一種唯分數論的應試教育方法,參見表2-1。

表2-1 監督模型

有應試教育,就有素質教育。素質教育并非沒有評價標準,但是相比應試教育要寬松很多,在考察過程中,手里可以有更多的主觀因素。這一點在非監督學習中同樣成立。如一句古話所言,“近朱者赤,近墨者黑”,要評價一個人如何,就看他平時和什么樣的人在一起。非監督學習中的各種聚類方法,同樣使用了這種思想,就是并不直接評價某一個體,而是看個體之間的接近程度,將眾多個體歸為少數幾個群體,再基于這個群體的特征進行簡要概括。

試卷中有主觀題和客觀題,我們用來類比的監督學習同樣可以分為這兩種。我們知道主觀題的答案,如語文閱讀、政治歷史問答題,是不要求跟標準答案完全一致的,其評價標準也是越接近越好;這一點就類似機器學習的回歸問題,比如用模型預測房價、股市走勢,大致預測出價格趨勢就非常了不起了,不可能圓、角、分全部正確才認為預測正確,差一分就預測錯誤。而簡單的客觀題,如判斷題、單項選擇題,只有固定數目選項,必須和標準答案完全一致才算正確的,這一點類似于機器學習的分類問題,比如預測一個人是否患有某種疾病,有就是有,沒有就是沒有。

注意,這里有一個誤區,即認為素質教育優于應試教育。現在機器學習領域中的吳恩達等學者也一再強調非監督算法的重要意義,實際上拿到一個學習任務后,具體使用哪一種方式去分析還是需要考慮應用場景的。通常我們不了解這個學習任務的目的性、需要找線索時,會用非監督找線索,包括聚類、降維方法等。如果明確了學習的目的性,追求高準確率,就需要使用監督學習的方法了。

由于本書是入門讀物,并且希望給讀者帶來快速上手的體驗,因此我們將在接下來的過程中主要介紹監督學習的分類部分。

主站蜘蛛池模板: 吉隆县| 东至县| 澎湖县| 天柱县| 汉中市| 汉沽区| 临漳县| 阿勒泰市| 宝兴县| 大新县| 富顺县| 陆河县| 永泰县| 阿尔山市| 巧家县| 抚松县| 石河子市| 仁布县| 奉新县| 陈巴尔虎旗| 绍兴市| 普定县| 永嘉县| 贺州市| 鲁山县| 泊头市| 昌吉市| 霍山县| 吉安县| 西乡县| 台南县| 连城县| 玉山县| 临洮县| 江华| 屏南县| 政和县| 象山县| 永平县| 武功县| 焉耆|