官术网_书友最值得收藏!

  • 圖解人工智能
  • (日)多田智史
  • 6334字
  • 2021-04-09 20:39:32

03 人工智能的發展

人工智能領域發生了很多里程碑事件。下面,我們來看看人工智能的歷史發展過程(圖 1-8)。

圖 1-8 1960 ~ 2010 年的人工智能歷史

1960 ~ 1980 年:專家系統和第一次人工智能熱潮

20 世紀 50 年代以來,基于使用了多個條件分支的自動判斷程序,搭載了推理機的問題處理系統相繼問世。專家系統就是其中之一,程序內部包含專家(expert)提供的知識與經驗。

早期開發的專家系統 DENDRAL 能夠利用物質的質譜分析結果,來識別有機化合物的分子結構(參照小貼士)。由此掀起了第一次人工智能熱潮。

小貼士 DENDRAL

DENDRAL 是由斯坦福大學的愛德華·費根鮑姆(Edward Albert Feigenbaum)教授等人于 1965 年開始開發的專家系統。該專家系統能像化學家一樣工作,即使用質譜分析法分析未知的有機化合物的質譜實驗數據,并判斷出該有機化合物的分子結構。DENDRAL 是世界上第一個專家系統。

在專家系統的基礎上,當時相當于人工智能的自動判斷處理程序又得到了進一步發展。

隨著人工智能熱潮的出現,人工智能框架問題(參照小貼士)也不可避免地成了人們討論的焦點??蚣軉栴}是約翰·麥卡錫(John McCarthy)和帕特里克·海耶斯(Patrick J. Hayes)于 1969 年提出的。在信息有限的情況下,程序篩選所需信息的計算量非常龐大,這就導致原本可以解決的問題變得無法解決——即便在當下,這個問題也很難找到一個有效的解決方法。

在 20 世紀 70 年代,專家系統被引入制造系統。由此問世的醫療專家系統 MYCIN(參照小貼士)等開始試運行。

小貼士 框架問題

只能在有限范圍內處理信息的機器人,無法處理所有實際發生的問題。

 

小貼士 MYCIN

MYCIN系統是在20世紀70年代由布魯斯·布坎南(Bruce Buchanan)和愛德華·肖特利夫(Edward Shortliffe)開發的專家系統。該專家系統由 DENDRAL 衍生而來。

1980 ~ 2000 年:第二次人工智能熱潮和神經網絡的寒冬期

進入 20 世紀 80 年代后,隨著計算機硬件成本的不斷下降,復雜的大規模集成電路得以實現,計算機的計算能力由此實現指數級增長。這就是摩爾定律(參照小貼士)。

小貼士 摩爾定律

1965年,美國英特爾公司的戈登·摩爾(Gordon Moore)在他的論文中指出,大規模集成電路上可容納的元器件數量每隔 18~24 個月便會增加一倍。

隨著集成電路上可容納的元器件數量的增加,計算機的存儲區域持續呈爆炸式增長,主存儲器中可存儲的數據類型越來越多樣化。人工智能領域的研究也因此受益,并發展到以國家為主導的持續提升計算機計算能力的階段。人工智能迎來第二次熱潮。

在此期間,神經網絡也得到了快速發展。20 世紀 60 年代提出的單層感知器因為無法處理非線性分類問題而陷入低谷,由多個感知器(參照小貼士堆疊組成的多層感知器則解決了非線性分類問題。

但隨后,因計算機性能方面的限制,第二次人工智能熱潮遇到了瓶頸。自 20 世紀 90 年代開始,人工智能的研究陷入低谷。這一時期又稱為人工智能的寒冬期。

小貼士 感知器

感知器由弗蘭克·羅森布拉特(Frank Rosenblatt)于1957年提出,是一種人工神經元和神經網絡。

2000 ~ 2010 年:統計機器學習方法和分布式處理技術的發展

以 20 世紀 80 年代發展起來的神經網絡(參照小貼士)為基礎的人工智能研究,雖然在后期陷入了低谷,但是基于統計模型的機器學習算法等取得了穩步發展。

20 世紀 90 年代,基于貝葉斯定理(參照小貼士)的貝葉斯統計學被重新定義。21 世紀以后,開始出現了使用貝葉斯過濾器的機器學習系統,并逐漸普及(圖 1-9)。貝葉斯過濾器的典型應用示例就是垃圾郵件過濾系統。除此之外,它還可用于語音輸入系統中的降噪和語音識別處理。

圖 1-9 貝葉斯定理和貝葉斯過濾器

小貼士 神經網絡

神經網絡的作用在于參考人腦,通過計算機仿真方法模擬其部分功能。

 

小貼士 貝葉斯定理

貝葉斯定理是皮埃爾 - 西蒙·拉普拉斯(Pierre-Simon marquis de Laplace)提出的關于條件概率成立的定理。對于通常情況下的概率和條件概率,下面的恒等式成立。

使用統計學方法解決的課題可以分為兩大類:分類預測。機器學習利用程序自動計算輸入數據,以此來推導特征值,實現分類和預測的功能(圖 1-10)。在多數情況下,這些特征值還需要數據科學家檢測它們的構成要素和貢獻率并進行深入分析,不過我們也可以通過構建模型使處理自動化。

圖 1-10 機器學習的典型功能:分類和預測

機器學習的應用示例包括推薦引擎,以及使用了日志數據及在線數據的異常檢測系統。

20 世紀 90 年代后期,隨著互聯網的普及,多媒體數據等大容量數據的應用變得越來越廣泛(圖 1-11)。因此,提高圖像數據和音頻數據處理效率的需求應運而生。

圖 1-11 黑白二色→ 16 色→ 256 色→ 1677 萬色的圖畫和動畫

FPGA(Field-Programmable Gate Array,現場可編程門陣列)等嵌入式技術可以迅速實現視頻等多媒體數據的壓縮和轉換等處理,但是需要根據處理對象的內容進行優化,這與面向普通計算機 CPU 的編程方法不同,需要我們另行學習。

為了靈活處理數據,過去人們使用的,是用于科學計算等領域的大型計算機(超級計算機)所提供的分布式計算環境。但 2000 年以后出現了 OpenMP(參照小貼士)和與 GPGPU(General-Purpose computing on Graphics Processing Units,通用圖形處理器)相關的技術 CUDA(Compute Unified Device Architecture,統一計算設備架構),它們提供的是多核計算環境和異構計算環境,像計算機一樣可以由個人來操作(當時還比較昂貴)。

小貼士 OpenMP

OpenMP 是進行并行處理的基礎。

與按照指令執行的分布式處理機制一樣,一些軟件中也添加了分布式處理的管理機制。例如 Google 以 Google 文件系統(Google File System)為開端開發的 MapReduce 架構(圖 1-12),還有 Yahoo! 在 MapReduce 的基礎上開發的 Hadoop。分布式系統不僅可以為每個任務預定義計算資源,還能通過網絡線路進行任務管理,所以能夠隨意地增減資源。

圖 1-12 MapReduce 架構

從 2005 年左右開始,高效的分布式處理和摩爾定律所帶來的計算機硬件的性能提升推動了神經網絡研究的再次興起。

2006 年,隨著自編碼器(參照小貼士)的出現,人工智能的發展進入了深度學習(參照小貼士)時代。

深度神經網絡(Deep Neural Network,DNN)是一種支持深度學習的多層神經網絡。當時,超過 5 層的神經網絡就稱為深度神經網絡,因為受到計算機性能的限制,很難構建更多的層。到了 2010 年以后,就已經能構建出 100 多層的深度神經網絡了。

小貼士 自編碼器

自編碼器是在2006年由杰弗里·辛頓(Geoffrey Hinton)提出的一種使用神經網絡進行數據維度壓縮的算法,可在機器學習中使用。

 

小貼士 深度學習

深度學習指計算機程序通過學習各種數據的特性,對數據進行分類和判別。深度學習的概念最初由辛頓等人提出,現在的深度學習遠比當時的復雜。

2010年以后:深度神經網絡帶來圖像識別性能的飛躍性提高,第三次人工智能熱潮

以前,在圖像識別精度方面,基于統計模型的機器學習要優于基于神經網絡的機器學習,但在某個階段之后,這種優勢出現了顛覆性的逆轉。最典型的示例就是 2012 年 ImageNet 大規模視覺識別挑戰賽 ILSVRC 2012(IMAGENET Large Scale Visual Recognition Challenge)的圖像分類任務。加拿大多倫多大學團隊開發的基于深度學習的圖像識別算法摘得桂冠(圖 1-13)。

圖 1-13 ILSVRC 2012 的圖像分類任務結果

和第三名東京大學團隊使用的統計機器學習算法相比,多倫多大學團隊使用的深度學習算法將錯誤識別率降低了 10%,在業界引起轟動。人類的錯誤識別率約為 5%,而在 2015 年出現了錯誤識別率低于 5% 的算法。

基于深度學習的圖像識別算法的有效性迅速得到認可。人們建立大型數據庫來存儲圖像和元數據之間的關聯,并提供給用戶使用,因此在汽車上裝載圖像識別引擎的研究也逐漸活躍起來(圖 1-14)。除了圖像識別領域,深度學習在語音識別領域和自然語言處理領域也取得了一定成效,逐漸被應用到聊天機器人程序中。

圖 1-14 圖像識別引擎的應用領域

加速產業上的應用

汽車產業

快速發展的人工智能研究已經在各個產業中得到應用,其中包括從 20 世紀開始成為日本支柱產業之一的汽車產業。特別是在圖像識別領域,人工智能作為自動駕駛技術必不可少的要素之一受到重視。以往主要推進的是除圖像識別以外的汽車內置傳感器和埋入式道路傳感器裝置等基礎設施一體機的開發,后來圖像識別精度的提高使汽車產業取得了飛躍性的發展。今后我們將不再局限于從單臺車輛獲得數據,而是收集多臺車輛的加速度傳感器采集的數據,預測全國范圍的交通量,收集事故多發路段的信息,然后通過大數據分析,不斷推動自動駕駛的實現。

廣告產業

目前很多網站使用基于機器學習的推薦系統,向網站用戶推送相關廣告和新聞,以及優化廣告投放。

我們可以把其中的推薦引擎理解為機器學習所做的預測結果。為了更加有效地對用戶進行推薦,除用戶訪問的網站之外,購物網站的推薦引擎還會利用用戶的購買記錄等信息構建統計模型,實現有效推薦。

另外,網站上顯示的相關信息也是推薦引擎的一種處理形態。在對主要內容和相關內容進行信息的相似度分析,并根據相似度來判斷如何有效利用或限制這些信息(相同的話題沒有意義,但也不能過度偏離),以及如何最大程度提升用戶回流率(引導用戶訪問網站和促進用戶購買)方面,優化處理顯得尤為重要。

廣告產業對系統的要求是提供有效的廣告時間策略以及呈現高度相關的內容。預計今后包括深度學習在內的機器學習算法會在構建此類系統方面逐步得到應用。另外,開發出既能處理文本和數值數據,又能涵蓋圖像、視頻和音頻等多媒體數據(原始數據,而非藝術家的名字等標簽或類別)資源的推薦引擎,將有助于提高推薦內容與用戶喜好的匹配度。

BI 工具

企業在制定經營戰略時必須預測銷售額和利潤。在此過程中,BI(Business Intelligence,商業智能)工具不可或缺。最初的 BI 工具可以追溯到 20 世紀 70 年代的計算機輔助決策支持系統。

隨著可處理數據量的增加和計算機處理能力的提高,再加上為了迎合企業需求,BI 工具的預測準確率越來越高。

縮短統計周期是 BI 工具的一個典型特征。在商品的庫存管理方面,很重要的一點就是最大限度地降低庫存數量。在根據過去的走勢預測未來的變化趨勢時,如果預測周期較長,預測結果就容易出現偏差,所以要盡量縮短預測周期并反復進行預測。因此,原來主要的處理方式是批處理,但如今在線處理流處理的重要性急劇提升。

另一方面,預測涉及的數據對象趨于多樣化。除地理特征、人口系統動態特性社會心理特征以外,所在地區的天氣、氣溫、附近的交通量等信息也是影響預測的重要因素。我們需要從海量數據中提取關聯度較高的信息并進行預測,所以機器學習算法起著非常重要的作用。

過去靠個人經驗所做的預測已經通過信息處理實現了機械化。進入 21 世紀后,開發者利用 Google Prediction API 開發了基于貝葉斯網絡的缺失數據預測程序。后來,用戶可以通過 Google BigQuery 上傳大量數據進行分析并很快得到分析結果。另外,硬件系統的性能也得到提升,具體表現為 Apache HadoopApache Spark 等大規模分布式處理技術的靈活應用等。

將來,我們會開發出更多的系統來完成一直以來由人類實施的處理。比如,通過改善機器學習算法來有效檢索各種類型的信息,同時進行數據清洗稀疏數據處理等。相信這些系統的開發能大大促進技術進步。

對話式人工智能

2000 年前后,在對話式人工智能領域,聊天機器人等機器人程序大受歡迎。這些聊天機器人雖然制作精良,但只能用來取悅用戶,缺乏實用性。具備實用性的聊天機器人并沒有通過機器學習等高級算法來實現,而是用了會提示用戶按照流程圖輸入信息的系統。前面介紹了廣告產業中主題模型的發展,隨著這些自然語言處理模型在性能方面的提升,機器人程序得到改良,與人自然地進行對話成為可能。當然,翻譯技術的發展也做出了很大貢獻。再加上 2005 年以后計算機資源的擴展,大量的文本數據處理及特征提取得以實現,文本特征表示模型終于建立。這也是機器人能夠自然與人對話的一個主要原因。

例如,微軟于 2015 年發布的小冰 4 就通過深度學習技術逐漸實現了近乎自然的人機對話。

4微軟發布的人工智能聊天機器人,中國版為小冰,日本版為 Rinna(りんな),美國版為 Tay?!g者注

在 2015 年至 2016 年,一些大型 SNS 網站向開發者開放了用于開發聊天程序的 API。預計今后自然語言處理領域的對話式人工智能在商業上的實用性會越來越高。

醫療護理輔助

IBM 公司開發的超級計算機沃森(Watson)包含利用了深度學習的系統。與其他系統不同,沃森使用的是認知計算(cognitive computing)系統。認知計算系統的價值體現在通過自然語言處理進行人機對話和提供決策支持上。

下面我們來看一下沃森在醫療領域的應用。

近幾年,隨著研究水平的不斷提高以及參與研究的國家和機構的不斷增多,學術領域分類越發細化,論文發表數量多到醫生無法消化的程度。人們期待沃森能起到輔助診療的作用,具體來說就是讓沃森讀取大量的醫學文獻,根據患者癥狀,列出疾病的相關信息以及適用的藥物和治療方案。

特別是針對癌癥和心臟病等常見疾病,時常會有新的論文發表或者有來自監管部門的指示。因此,如何與醫生及其他醫務人員順利合作,如何與當局的規定進行比較調整,都是未來我們需要重視的地方。

機器學習的應用案例還包括影像診斷中癌癥的早期發現、使用了腕帶式測量設備的健康管理系統等。隨著技術的進一步發展,今后或許能在全國范圍內實現基于個人數據的私人定制醫療服務。

機器人產業

在機器人領域,包括機器學習在內的人工智能研究也得到了有效利用。在汽車產業中,人工智能的研究成果可作為交通工具來使用,而在機器人領域則可作為人類的助手,輔助移動身體,或替代人類完成某些工作。機器人雖然能夠最大限度完成其擅長的重物搬運等工作,可一旦迅速轉換到它不擅長的精細作業,就有些捉襟見肘了。要讓機器人像人類一樣自然地工作,還是有一定難度的。

為了解決這個問題,人們長期以來致力于開發一種能夠通過自主學習來實現自我控制行動的人腦計算機。預計未來還會在開發中引入強化學習算法。

除此之外,機器人未來也可能在兒童益智玩具和老年人生活支援服務等領域得到應用。生活支援的范圍很大,除食材管理和根據氣候變化提出行動方案之外,還包括預防阿爾茨海默病。我們知道,未來日本國內的勞動力人口會持續下降,人工智能研究除了用于輔助年輕人的工作,在如何保障老年人的健康生活,以及在健康狀況不佳時如何保證生活質量(Quality Of Life,QOL)等方面,都有非常重要的作用。

人工智能的未來

人工智能在未來是否會擁有意識,現在我們還不得而知。但是,很多研發人員和工程師希望人工智能可以擁有意識。

數字克隆人是人工智能在未來的發展方向之一。數字克隆人是人類個體的思維方式和興趣愛好的數字復制品,但是,數字克隆人的開發可能只是一種用于實現人格的技術。這與圖靈測試的要求很像,如果我們能夠實現“學習模仿人類”的技術,似乎就可以實現數字克隆人。2015 年左右,人們已經開發出用于實現此目標的傳感技術,由此實現了很多事情,例如根據圖像來推測面部表情,并將其與情緒關聯等。今后利用傳感技術模擬人格的嘗試會越來越多。

此外,信息技術進步的速度按照摩爾定律呈指數增長,它同樣遵循雷·庫茲韋爾(Ray Kurzweil)提出的加速回報定律 5(the law of accelerating returns)。加速回報定律也涵蓋了熵增定律的內容,所以該定律同樣適用于信息量的增長。

5引自雷·庫茲韋爾所著的《機器之心》,中信出版社 2016 年出版?!g者注

如何處理大數據

長期以來,數據處理系統的處理能力一直受限于計算機的運算能力,所以人類一直致力于用最少的信息量實現觀察和控制事物,并迎合其發展趨勢。然而,自 2010 年以來,我們不僅得到了包括各種傳感數據在內的多種類型的數據,還得到了相應的數據處理工具。這就意味著我們在處理數據的同時,必須考慮這些持續增多的信息中有哪些是有用的信息、計算機要如何處理數據才能得到答案等問題。

技術奇點來臨

庫茲韋爾預計技術奇點將于 2045 年到來。雖然我們擁有通過機器學習系統從大量信息中尋找解決方案的方法,但仍然需要花費時間進行數據清洗等預處理。想讓機器能夠自主尋找解決方案,我們還有很長的路要走。

即使計算機能夠處理和計算大量數據,并自主找到答案,也還是需要人類來設定問題,而且在設定問題和尋找答案的過程中,各種討論和靈感都來源于人類(這是人類的特權,也是苦惱所在)。將來,把各種功能的小型人工智能程序組裝到一起,讓它們互相通信,共同協作,以此來解決更大問題的設想終會實現。這只是時間問題。

但是,即使機器萌生了意識,很多地方還有待討論,比如是使用現有方法還是其他方法來讓機器具備自行尋找答案的能力等。這為未來的人工智能研究增添了趣味性。

主站蜘蛛池模板: 万荣县| 宝鸡市| 四平市| 肥城市| 荣成市| 绍兴县| 杭锦后旗| 龙胜| 韶山市| 遂昌县| 库车县| 洛川县| 淮滨县| 哈巴河县| 塘沽区| 德清县| 上思县| 梁河县| 中超| 龙海市| 肃宁县| 巫山县| 通榆县| 信阳市| 仙桃市| 湄潭县| 乌鲁木齐县| 勃利县| 孝昌县| 北流市| 富阳市| 周宁县| 通城县| 上杭县| 阳朔县| 南川市| 凤翔县| 天峨县| 开远市| 彭山县| 德江县|