官术网_书友最值得收藏!

1.3 人工智能的技術(shù)原理

那么,到底如何實現(xiàn)人工智能呢?人工智能的技術(shù)原理到底是怎樣的呢?受限于計算機理論和計算機軟件條件的限制,人工智能在不同的階段采用了不同的技術(shù)途徑。

第一代人工智能基于規(guī)則,機器根據(jù)配置和規(guī)則來完成任務。

第二代人工智能基于傳統(tǒng)機器學習,根據(jù)有限的數(shù)據(jù),學習模型、完成任務。

第三代人工智能基于深度學習,根據(jù)大量的數(shù)據(jù),自行完成算法的迭代和學習,從而完成任務。

相較于第一代和第二代人工智能,基于深度學習的第三代人工智能所能完成的任務更多,效果更好。本節(jié)主要介紹以機器學習為導向的第二代人工智能和以深度學習為導向的第三代人工智能的技術(shù)原理。

1.3.1 機器學習和深度學習

機器學習的靈感來源于人類的學習方法。那么,人類是怎么學習的呢?人類是通過認識事物以及事物之間的關系來學習的。在此基礎上,人類還會進行相應的行為模仿,并且能夠基于對事物的認識進行推理。學習是一個貫穿人的一生的動態(tài)過程。簡單來說,人類學習的過程就是認識事物的概念和了解事物(概念)之間關系的過程。

人腦具有很多高級的功能,比如接收信息、存儲信息、交換信息,以及根據(jù)過去的經(jīng)驗學習事物的規(guī)則,從而使我們能夠理解語言、進行抽象推理,以及對視覺模式進行分類。人腦的這些高級功能,使得我們能夠快速、準確地從經(jīng)驗(感性知識)和數(shù)據(jù)(抽象知識)中學習復雜的知識結(jié)構(gòu)。即使是只有8個月大的嬰兒,也能發(fā)現(xiàn)口語中的規(guī)律,從而確定單詞之間的界限。

那么,怎么才能讓機器開始學習呢?(這里的機器指的是數(shù)字計算機,數(shù)字計算機只能處理數(shù)字信號。)要讓計算機進行學習,首先要把真實世界里的“事物”變成數(shù)字,其次要把“事物之間的關系”變成運算邏輯,機器學習就是讓計算機處理和學習數(shù)字之間的邏輯關系。

關于機器學習,周志華老師在他的著作《機器學習》中是這么描述的:

機器學習是這樣一門學科,它致力于研究如何通過計算的手段,利用經(jīng)驗來改善(計算機)系統(tǒng)自身的性能。

在計算機系統(tǒng)中,“經(jīng)驗”通常以“數(shù)據(jù)”形式存在,因此,機器學習所研究的主要內(nèi)容,是關于在計算機上從數(shù)據(jù)中產(chǎn)生“模型”的算法,即“學習算法”。

所以,對于一個實際問題,我們可以將利用人工智能解決這個問題的方法分為如下5個步驟。

第一步:提出問題。

第二步:準備數(shù)據(jù)。

第三步:訓練(學習)模型。

第四步:測試模型。

第五步:應用模型。

本書就是按照這樣的邏輯來安排內(nèi)容的。在后續(xù)章節(jié)中,大家將陸續(xù)學習如何準備數(shù)據(jù),以及如何利用不同的人工智能算法來訓練并測試模型。進一步地,大家還將學習如何利用一個已經(jīng)訓練好的人工智能應用來幫助我們實現(xiàn)一些功能。

機器學習有很多種分類方式。根據(jù)所使用數(shù)據(jù)形式的不同,我們可以定義不同的訓練任務。機器學習從任務類型上可以粗略地分為以下兩類:監(jiān)督學習(Supervised Learning)和無監(jiān)督學習(Unsupervised Learning)。監(jiān)督學習的訓練數(shù)據(jù)有明確的預期結(jié)果,而無監(jiān)督學習的訓練數(shù)據(jù)沒有明確的預期結(jié)果。

機器學習按照學習方法可以分為傳統(tǒng)機器學習和深度學習。深度學習主要模擬人腦的工作原理,通過一些被稱為“神經(jīng)網(wǎng)絡”的結(jié)構(gòu)來實現(xiàn),這些神經(jīng)網(wǎng)絡可以有很多層,因此得名“深度學習”。神經(jīng)網(wǎng)絡的每一層由數(shù)以千計的“神經(jīng)元”組成,它們可以自動學習數(shù)據(jù)的表示。隨著層數(shù)的增加,神經(jīng)網(wǎng)絡可以識別越來越復雜的模式。需要注意的是,深度學習是機器學習的一個重要分支。機器學習和深度學習并不是并列關系,而是包含關系。

1.3.2 機器學習三要素

數(shù)據(jù)、算法和模型是機器學習的三要素。數(shù)據(jù) + 算法 = 模型。

在特征的選取上,傳統(tǒng)機器學習是全人工的,而深度學習是半人工的。傳統(tǒng)機器學習對訓練數(shù)據(jù)量的需求比較小,而深度學習對訓練數(shù)據(jù)量的需求非常大。對于計算能力,傳統(tǒng)機器學習的需求較小,而深度學習的需求非常大。在所訓練出來的模型的自適應性上,傳統(tǒng)機器學習比深度學習稍弱,但前者訓練出來的模型具有較強的可解釋性。

傳統(tǒng)機器學習首先需要根據(jù)問題的性質(zhì)和數(shù)據(jù)的條件,選擇合適的模型類型和模型函數(shù)。常用的機器學習模型有線性回歸、邏輯回歸、樸素貝葉斯分類、k均值聚類、支持向量機、隱馬爾可夫模型、譜聚類等。

深度學習則主要由神經(jīng)網(wǎng)絡構(gòu)成。神經(jīng)網(wǎng)絡也稱為連接模型,是一種模擬人腦行為特征、進行分布式并行信息處理的數(shù)學模型,由神經(jīng)元和連接構(gòu)成。

神經(jīng)網(wǎng)絡是一種多層網(wǎng)絡,這種網(wǎng)絡依靠系統(tǒng)的復雜性,通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關系,實現(xiàn)網(wǎng)絡處理效果的最優(yōu)化。在后續(xù)章節(jié)中,我們將詳細介紹如何使用神經(jīng)網(wǎng)絡搭建深度學習算法,并訓練和測試相關模型。

深度學習的發(fā)展經(jīng)歷了從追求深度到追求神經(jīng)元的復雜性,并不斷尋求不同類型的深度神經(jīng)網(wǎng)絡的過程,其間出現(xiàn)了卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)、長短期記憶(Long Short-Term Memory,LSTM)模型等。近些年,也有Attention、Transformer等更高效的類神經(jīng)網(wǎng)絡的深度學習機制出現(xiàn)。可以說,對于不同的應用,我們可以構(gòu)造多種多樣的深度學習模型來完成任務。

主站蜘蛛池模板: 河北省| 石首市| 菏泽市| 桃园市| 益阳市| 浏阳市| 德江县| 彰化市| 安顺市| 壶关县| 合川市| 高邮市| 滨州市| 土默特左旗| 腾冲县| 浦北县| 盐津县| 东丰县| 石泉县| 苏尼特右旗| 织金县| 五寨县| 云梦县| 泾源县| 奉贤区| 茶陵县| 中西区| 虞城县| 叙永县| 康乐县| 屏山县| 儋州市| 丁青县| 丹东市| 淮南市| 佛冈县| 大悟县| 牙克石市| 舟山市| 桐梓县| 广元市|