官术网_书友最值得收藏!

1.1 自學成才的人工智能

先秦時期的道家經典《列子·湯問》中記載了一個“偃師造人”的故事:周穆王西游時遇工匠偃師獻寶,寶貝是一個木偶歌舞藝人,體態、相貌極似真人,時而曼聲吟唱、應節合拍,時而翩躚起舞、輕盈美妙,動作千變萬化,尤勝真人。這是中國最早的關于機器人的科幻故事,寄托了古人對擁有智能器械的美好愿望。

人工智能(artificial intelligence,AI),是一門研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的技術科學。

具體來說,人工智能研究智能的實質,制造出具有一定智能的機器,承擔以往具備人的智力才能勝任的工作。簡單來說,人工智能就是試圖制造一種具有人類智慧且能充分理解人類意圖的工具。

過去的數十萬年,無論人類發明了什么工具,都要主動學習它、使用它;而人工智能會主動學習如何更懂人類需求,并滿足人類需求。舉個例子,普通的車需要人類學習如何駕駛,而無人駕駛汽車會自行學習如何更安全、快捷地送乘客到達目的地。

現在的人工智能,可以看作你的私人秘書兼高參,可以幫你做PPT、寫文案、翻譯、畫圖、譜曲等,還可以幫你整理、分析數據并做出預測、輔助決策,甚至可以幫你開車、做家務等,不提要求、不拿工資、24小時陪伴,雖然能力還差強人意,但一直在提升中,直到完全合乎你的心意。

這也是賦能。試想,一個人是單槍匹馬時厲害,還是有一群幫手輔助時厲害?

所以,人工智能寄托了人類一直以來的一個夢想:希望制造一種工具,像人一樣聰明,幫助自己完成所有事情,完全遵從自己的意志,又不存在主仆關系。

這么完美的工具,要如何制造呢?

1.符號主義的成功:深藍大戰卡斯帕羅夫

方法:先由專家總結出知識和規律,灌輸給計算機,計算機再按照專家設定好的邏輯系統推理、判斷并執行。

舉個簡單例子:專家先總結出輸出y和輸入x存在y=(2x+3)×6的函數關系,灌輸給計算機,然后令x=1,2,3,…,n,讓計算機求y的值。

此時的AI還不能自己學習,需要人教給它所有的規則。

這是符號主義學派的做法。

對人工智能的研究逐漸分化為三大學派:符號主義、連接主義和行為主義。

符號主義又稱邏輯主義或計算機學派。符號主義理論是一種基于邏輯推理的智能模擬方法,認為人工智能必須依托于邏輯系統,每一個判斷、動作都基于強有力的邏輯關系,是對預設的準確反饋。

符號主義理論的典型應用是在1997年,IBM的深藍打敗人類國際象棋冠軍卡斯帕羅夫。深藍主要是用人類專家提煉出來的邏輯和人類進行對決。

符號主義理論的優點是能夠模仿人類的推理和思考的過程,決策具有可解釋性,但也存在很多缺陷。首先,根據哥德爾不完備定理,邏輯上找不到能夠表述一切的邏輯體系。其次,本質缺陷還在于符號主義理論只考慮理性認知的智能,忽略了人類智能的感性認知。

比如在語義理解方面,語言專家們雖然總結出了主、謂、賓、定、狀、補等語法規則,但不可能像數學公式一樣,列舉所有的情況。

舉個例子,你和女友約會,女友說:“如果你早來,我沒來,你等著;如果我早來,你沒來,你等著!”

這理性嗎?有什么邏輯?符號主義理論下的人工智能,像一個腦筋比鋼筋還直的“鋼鐵直男”,一臉迷茫,將完全體會不到女友的言外之意。

如何教會機器,讓它能理解并做出正確應對?語言專家們多番嘗試后,紛紛表示,太難了。

不教了,自己學去!

2.舉一反三的機器學習

如何自學呢?

在上一小節的例子里,輸出y和輸入x存在的函數關系y=(2x+3)×6,是人類專家總結的?,F在,讓人工智能自己推導出xy的函數關系,前提是把大量已知的xy數據扔給它。

舉個例子,老師問同學:

“當x=1時,y=30,求xy的函數關系fx)?!?/p>

y=30x,30倍關系?!睂W生A搶答。

“還有y=x+29,y=2x+28,y=3x+27……”看穿一切沒那么簡單的學霸B答道。

“對,再補充一組數據,當x=2時,y=42?!崩蠋煹?。

y=(2x+3)×6?!?/p>

“那么當x=3時,y的值是多少?”

“54?!?/p>

人工智能系統就這么實現了一次機器學習的過程。從數據中歸納出知識,再用知識解決新問題。

(1,30)和(2,42)是我們“喂”給人工智能系統的訓練數據,fx)是人工智能系統從訓練數據中歸納出的知識,這一知識被用來解決x=3時的問題。

我們也發現,如果訓練數據過少,就得不出真正的fx),也就無法從中歸納出正確知識獲得智能。這就是人工智能需要大數據的原因。

此時再看機器學習的定義:機器學習是一種從數據中自動學習模型的方法,可以從數據的分析中發現規律和模式,以便對未知數據做出預測或決策。簡單理解,就是把歷史數據“喂”給機器,讓機器自己從數據中找規律。

于是,人類不必多說話,只向“無知”的人工智能扔了一堆大數據。

3.連接主義的勝利:阿爾法狗戰勝李世石

作為人工智能的頂流——機器學習,成名之戰是在2016年,阿爾法狗(AlphaGo)打敗當時的世界圍棋冠軍李世石。

阿爾法狗前期被輸入了3000多萬步人類圍棋大師的走法,并在此基礎上利用算法自我博弈,產生了數以千萬計的海量“機器棋局”大數據,通過深度學習,從中訓練出一套走棋程序(規則),最終戰勝了李世石。

阿爾法狗能夠實現機器學習,主要歸功于連接主義。

連接主義,又稱仿生學派或生理學派。連接主義理論源于仿生學,特別是人腦模型的研究,采用基于神經網絡及網絡間連接機制與學習算法的智能模擬方法,強調形成類似于人腦的神經網絡,靠人工神經網絡形成意識自行思考。

人工神經網絡是什么呢?

4.人工神經網絡讓計算機也有“腦回路”

人工神經網絡,是一種能夠學習和適應不同數據模式的機器學習算法,它從模仿生物的神經元開始。

人們發現,生物的神經元細胞是生物智能的基本來源。神經元細胞比較特殊,一般長有很多樹突(輸入部分)和一根軸突(輸出部分)。軸突邊緣有很多突觸,可以連接到其他神經元細胞的樹突上(一個神經元的輸出成了另一個神經元的輸入)。很多神經元細胞這樣互相連接,構成了復雜的生物神經網絡,實現信息的處理和傳遞,使得生物有了智能。

人們在計算機中通過編程的方式模仿生物神經網絡,實現了人工神經網絡。可以這樣理解,單個人工神經元是一種運算結構,有一個或多個輸入,通過非線性函數變換(該非線性函數在學習過程中是可變的)得到一個輸出。而這個神經元的輸出可以是另一個神經元的輸入,許多單一神經元連接在一起,構建起復雜的網絡,通過復雜網絡的逐層計算、歸納,逐步將抽象的原始數據變得具體。

這種人工神經網絡可以看作一個非常大的數學模型,里面有很多參數,達到一定規模,就會表現出類似于生物智能的現象。

圖1-1是一個簡單的人工神經網絡結構。

圖1-1 一個簡單的人工神經網絡結構

圖中,L1層是“輸入層”,有3個“輸入單元”,標“+1”的圓圈稱為“偏置節點”,不計在內。L3層是“輸出層”,有1個“輸出單元”,復雜的神經網絡的輸出層會有多個“輸出單元”。L2層叫作“隱藏層”(一般視為黑匣子,其值無法集中觀測到),有3個“隱藏單元”。圖1-1中只有一個隱藏層,但復雜的神經網絡會有很多隱藏層hw,bx)就是神經網絡算法提供的一種復雜的非線性假設模型,具有參數wb,可以用此參數來擬合任意數據。

5.可擬萬數的萬能近似定理

再回到上個例子:

“很好,B同學通過歷史數據(1,30)和(2,42),歸納出了y=(2x+3)×6的函數關系,”老師稱贊后,隨即話題一轉,“如果再補充一組數據(3,55)呢?”

x=3時,y=(2×3+3)×6,y不應該是54嗎?”學霸B也困惑了。

“54只是預期輸出,55才是現實結果。

“這說明x、y還有更復雜的函數關系,需要不斷調整fx)的參數,讓預期輸出和真實結果55無限接近。

“在y=ax+b的函數關系中,ab是需要不斷調整的參數?!崩蠋熃忉尩?。

人工神經網絡的功能就是通過調整各層的參數,擬合出任意復雜度的函數。

人工神經網絡是有數學原理支撐的,一般稱之為萬能近似定理(universal approximation theorem)或萬能逼近定理,即只要激活函數(如logistic sigmoid激活函數)選擇得當,神經元的數量足夠多,至少具有一個隱藏層的神經網絡,就能以任意的精度近似閉區間上任意一個連續函數。

簡單來說,人工神經網絡可以學習到輸入數據與輸出之間的復雜非線性關系,從而實現對目標函數的逼近,不管這個函數的表達有多么復雜。

當然,這需要人工神經網絡有足夠的深度。

6.深度學習讓“腦回路”更深

顯而易見,要解決的問題越復雜,需要的神經元就越多,構建起的人工神經網絡就越復雜。

人腦的神經元可以連接起來構建復雜的三維立體結構,但人工神經網絡還只能做到二維,并且每層的神經元只能連接下一層的神經元,不能跨層連接。這樣一來,層數多了,“深度”也就有了,也就得出了深度學習的概念。

深度學習作為一種機器學習方法,核心就是人工神經網絡。包含多層的人工神經網絡就是一種深度學習結構,深度學習也被稱為深度神經網絡。

總之,深度學習的“深度”,可以理解為從人工神經網絡的輸入層到輸出層所經歷層次的數目,即隱藏層的層數。越復雜的問題,需要的層次越多。

比如,阿爾法狗的策略網絡包含13層卷積神經網絡,每層都包含數百個神經元。

研究表明,人的大腦皮層的溝壑越多,就越聰明;后天的知識積累越多,溝壑就越深。愛因斯坦比普通人的大腦溝壑都要多且深,也算同理。

一般來說,人工神經網絡層數越多,則非線性表達能力越強,擬合能力越高,深度學習性能越好。

簡單總結來說,機器學習、神經網絡、深度學習是逐次包含的關系。人工神經網絡通過模擬人腦神經結構,滿足了機器像人一樣學習的硬件條件;深度學習通過人工神經網絡來實現,提供了機器學習的方法;大數據提供了足夠多的學習資料;再有支持眾多人工神經網絡節點運算的算力資源,機器就能搬個小板凳安靜地開始自學成才了。

主站蜘蛛池模板: 潜江市| 霍州市| 敦煌市| 瑞金市| 五原县| 海晏县| 太原市| 乌鲁木齐市| 曲沃县| 稻城县| 高唐县| 勃利县| 长顺县| 仪征市| 科技| 茂名市| 东阳市| 台江县| 板桥市| 安国市| 安龙县| 石狮市| 达日县| 峡江县| 永宁县| 东明县| 北碚区| 贡山| 宜春市| 钦州市| 水富县| 庄浪县| 巴马| 方正县| 武安市| 灯塔市| 遵化市| 军事| 汉沽区| 轮台县| 昌图县|