- 人工智能(AI)應用從入門到精通
- 蘇秉華 吳紅輝 滕悅然編著
- 1636字
- 2020-11-18 12:00:34
二、算法
當前,人工智能算法已經能夠完成智能語音語義、計算機視覺等智能化任務,在棋類、電子游戲對弈、多媒體數據生成等前沿領域取得了一定進展,為人工智能應用落地提供了可靠的理論保障。
1.算法的設計邏輯
人工智能算法的設計邏輯可以從“學什么”“怎么學”和“做什么”三個維度進行概括。
首先是學什么。人工智能算法需要學習的內容,是能夠表征所需完成任務的函數模型。該函數模型旨在實現人們需要的輸入和輸出的映射關系,其學習的目標是確定兩個狀態空間(輸入空間和輸出空間)內所有可能取值之間的關系。
其次是怎么學。算法通過不斷縮小函數模型結果與真實結果誤差來達到學習目的,一般該誤差稱為損失函數。損失函數能夠合理量化真實結果和訓練結果的誤差,并將之反饋給機器繼續做迭代訓練,最終實現學習模型輸出和真實結果的誤差處在合理范圍。
最后是做什么。機器學習主要完成三件任務,即分類、回歸和聚類。目前多數人工智能落地應用,都是通過對現實問題抽象成相應的數學模型,分解為這三類基本任務進行有機組合,并對其進行建模求解的過程。
2.算法的主要任務
人工智能實際應用問題經過抽象和分解,主要可以分為回歸、分類和聚類三類基本任務,針對每一類基本任務,人工智能算法都提供了各具特點的解決方案,如表3-1所示。
表3-1 人工智能主要算法分類

(1)回歸任務的算法。回歸是一種用于連續型數值變量預測和建模的監督學習算法。目前回歸算法最為常用的主要有四種,即線性回歸(正則化)、回歸樹(集成方法)、最鄰近算法和深度學習。
(2)分類任務的算法。分類算法用于分類變量建模及預測的監督學習算法,分類算法往往適用于類別(或其可能性)的預測。其中最為常用的算法主要有五種,分別為邏輯回歸(正則化)、分類樹(集成方法)、支持向量機、樸素貝葉斯和深度學習方法。
(3)聚類任務的算法。聚類算法基于數據內部結構來尋找樣本集群的無監督學習任務,使用案例包括用戶畫像、電商物品聚類、社交網絡分析等。其中最為常用的算法主要有四種,即K均值、仿射傳播、分層/層次和聚類算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)。
3.新算法不斷提出
近年來,以深度學習算法為代表的人工智能技術快速發展,在計算機視覺、語音識別、語義理解等領域都實現了突破。但其相關算法目前并不完美,有待繼續加強理論性研究,也不斷有很多新的算法理論成果被提出,如膠囊網絡、生成對抗網絡、遷移學習等。
(1)膠囊網絡是為了克服卷積神經網絡的局限性而提出的一種新的網絡架構。卷積神經網絡存在著難以識別圖像中的位置關系、缺少空間分層和空間推理能力等局限性。受到神經科學的啟發,人工智能領軍人物Hinton提出了膠囊網絡的概念。膠囊網絡由膠囊而不是由神經元構成,膠囊由一小群神經元組成,輸出為向量,向量的長度表示物體存在的估計概率,向量的方向表示物體的姿態參數。膠囊網絡能同時處理多個不同目標的多種空間變換,所需訓練數據量小,從而可以有效地克服卷積神經網絡的局限性,理論上更接近人腦的行為。但膠囊網絡也存在著計算量大、大圖像處理上效果欠佳等問題,有待進一步研究。
(2)生成對抗網絡(GAN:Generative Adversarial Networks)是于2014年提出的一種生成模型。該算法的核心思想來源于博弈論的納什均衡,通過生成器和判別器的對抗訓練進行迭代優化,目標是學習真實數據的分布,從而可以產生全新的、與觀測數據類似的數據。與其他生成模型相比,GAN有生成效率高、設計框架靈活、可生成具有更高質量的樣本等優勢,2016年以來研究工作呈爆發式增長,已成為人工智能一個熱門的研究方向。但GAN仍存在難以訓練、梯度消失、模式崩潰等問題,仍處于不斷研究探索的階段。
(3)遷移學習是利用數據、任務或模型之間的相似性,將學習過的模型應用于新領域的一類算法。遷移學習可大大降低深度網絡訓練所需的數據量,縮短訓練時間。其中,Fine-Tune是深度遷移學習最簡單的一種實現方式,通過將一個問題上訓練好的模型進行簡單的調整使其適用于一個新的問題,具有節省時間成本、模型泛化能力好、實現簡單、少量的訓練數據就可以達到較好效果的優勢,已獲得廣泛應用。