- 深度學習自然語言處理實戰
- 開課吧組編 張楠 蘇南 王貴陽等編著
- 2616字
- 2021-04-22 17:09:09
1.1 深度學習概況
1.1.1 深度學習的歷史
在當前的社會工業生產和科學研究中,人工智能都扮演著重要的角色,但是目前階段人工智能是先有人工,再有智能。人們在現存的海量數據的學習中找到數據后面隱藏的潛在規律以預測未知的事物。人工智能是一個很廣的范疇,它是機器學習在學習人類智能方面的一個巨大的嘗試和進步,這門科學是由計算機、心理學、生物學和哲學等多個學科共同組成的。
人工智能(Artificial Intelligence,AI)是一個綜合性的領域,了解人工智能的范疇是很重要的。在人工智能中,包括了機器學習(Machine Learning,ML),深度學習(Deep Learning,DL)等。機器學習是人工智能的核心,也是智能化計算機的主要途徑。它主要通過研究計算機是怎么模擬和實現人類的學習行為來獲取新的知識和技能,然后不斷修正自身的問題,使得知識結構不斷得到改善。深度學習是基于機器學習的新研究方向,有時候人們會認為深度學習是更加復雜的機器學習。深度學習在推薦算法、數據挖掘、機器翻譯、語言識別、計算機視覺(Computer Vision,CV),自然語言處理(Natural Language Processing,NLP)等方面有了長足的進步。它們的關系如圖1-1所示。

●圖1-1 人工智能領域關系圖
因此,有人認為,人工智能是目的,是結果;而機器學習和深度學習是方法,是工具。
本書將主要介紹深度學習在自然語言處理應用中的方法和實踐。縱觀深度學習的歷史,可以發現這門學科可以追溯到1943年由神經科學家麥卡洛克(W.S.McCulloch)和數學家皮茲(W.Pitts)在《數學生物物理學公告》上發表的論文《神經活動中內在思想的邏輯演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity)。這兩位科學家在當年已經建立了神經網絡和數學模型,稱為MCP模型。MCP模型其實就是按照生物神經元的結構和工作原理構造出來的一種抽象和簡化了的模型,也就誕生了所謂的“模擬大腦”,人工神經網絡的大門由此開啟。
1958年,計算機科學家羅森布拉特(Rosenblatt)提出了感知機(Perceptron)這個由兩層神經元組成的神經網絡,并將MCP用于機器分類。1969年,美國人工智能學者馬文·明斯基(Marvin Minsky)在證明了感知機本質上是一種線性模型(Linear Model)后認為,它只能處理線性分類問題,這就等于直接否定了感知機的作用,神經網絡的研究也因此陷入了將近20年的停滯。
1986年,人工智能領域三大奠基人之一的杰弗里·辛頓(Geoffrey Hinton)提出了反向傳播(Back Propagation,BP)算法,這種算法使用Sigmoid函數進行了非線性映射以解決多層感知機中的非線性分類和學習的問題,這引發了神經網絡的第二次熱潮。1991年,有研究者指出了反向傳播算法存在著梯度消失的問題,使得無法對前面的層進行學習,這導致了深度學習的發展第二次陷入停滯。
2006年,杰弗里·辛頓又提出了“無監督預訓練對權值進行初始化+有監督訓練進行微調”以解決深層網絡訓練中梯度消失的問題,由此開始了深度學習的浪潮,這一年也被稱為深度學習元年。2011年,ReLU激活函數被提出用以解決梯度消失的問題。同年,微軟研究院和谷歌公司的語音識別研究人員先后采用深度神經網絡(Deep Neural Network,DNN)技術降低了語音識別中的錯誤率,達到了20%~30%,是語音識別領域十多年來最大的突破性進展。
2016年3月,由谷歌公司旗下Deepmind公司開發的AlphaGo在公開的圍棋大賽上以4∶1的總比分擊敗了圍棋世界冠軍——職業九段棋手李世石后一舉成名。在2017年5月舉行的中國烏鎮圍棋峰會上,它再次以3∶0的總比分擊敗了當時排名世界第一的圍棋冠軍柯潔,深度學習展示出來的學習能力和潛在的能量為業界所重視。
目前,人工智能領域已經成為最火熱的領域之一,它是一個具有眾多應用和研究課題的領域,并仍然在蓬勃發展。
1.1.2 “無所不能”的深度學習
縱觀深度學習的整個歷史進程,我們發現深度學習在工業生產、社會生活、科學研究中都發揮了巨大的作用。在產業界,深度學習得到了很多實際的應用,在智能助手方向上有諸如蘋果公司的Siri,亞馬遜公司的Alexa,小米公司的小愛同學,百度公司的小度等;在智能工業方面,如百度公司發布的阿波羅平臺計劃,特斯拉、Waymo等公司開發的無人駕駛汽車;在智慧城市和智慧交通等多個領域,深度學習都已經讓行業發生了翻天覆地的變化。
自然語言處理作為深度學習的重要組成部分之一,已經成為機器語言和人類語言之間溝通的橋梁,實現了人機之間交流的作用。自然語言處理可以分為兩個核心任務:自然語言理解與自然語言生成。自然語言理解就是可以使機器能夠具備人類的語言理解能力,自然語言生成是將非語言格式的數據轉換成人類可以理解的語言格式。在這些范疇內,自然語言處理算法已經有了很多應用。自然語言處理的應用場景有如下的例子:
機器翻譯(Machine Translation):2016年11月,谷歌公司基于Seq2Seq模型發布了谷歌神經機器翻譯系統,實現了語言之間的直譯技術,并在多項翻譯任務上實現了提升。此外,國內的百度、有道、金山等公司在翻譯國內的語料庫方面也進行了大量的嘗試,同時推出了針對文本的翻譯產品。這些巨頭公司常用的機器翻譯模型有Seq2Seq、BERT、GPT、GP T-2等。
聊天機器人(Chatbot):其實,交流不僅僅是存在于生物之間,自然語言處理讓人與機器也可以進行順暢的聊天。微軟小冰、小米公司的小愛同學等機器助理的發展讓人們都感受到了它們的價值,尤其是當自然語言處理遇到物聯網,智能音箱作為目前的主要流量入口之一,已經讓用戶和生產商越來越注重自然語言處理的發展。同時,聊天機器人可以通過機器實現與人類對話,對簡單的問題進行自動回復,提升了用戶滿意度和效率。在一些電商網站、游戲平臺,智能客服已經幫助雇主顯著地提升了服務質量。
情感分析(Sentiment Analysis):這是指利用自然語言處理和文本挖掘技術,對帶有情感的主觀性文本進行分析、處理和提取的過程。在現在的社會生活中,互聯網上每天都會產生大量的文本信息,這些信息表達的內容是多種多樣的。通過情感分析,可以快速掌握目前用戶的輿情信息。
自動語音識別(Automatic Speech Recognition,ASR):Siri在蘋果公司產品的應用就是典型的語音識別的應用。還有微信、釘釘等應用中的語音轉文字以及輸入法中的語音輸入轉換成文字輸出都使用了語音識別。
與此同時,深度學習也促使機器人學、物流管理、生物學、物理學和天文學等其他科學取得了長足的進步,深度學習已經逐漸變成一個讓企業和學界都重視的工具,人工智能與工業互聯網等領域勢必成為未來科技發展的重要方向。
以上種種都說明,在未來,以自然語言處理為代表之一的深度學習應用會影響到生活的方方面面。這是否意味著人類終有一天會被機器所取代呢?筆者認為,任何技術的進步都是挑戰與機遇并存,在被機器取代的同時,更多新的工作機會也將在未來被發現,因此,認真學好技術才是安身立命之本。我們不能改變技術的進步,但是可以從現在開始好好學習每一章節的內容。
- JBoss AS 5 Development
- 突破平面Premiere Pro 2022短視頻與視頻制作
- Photoshop CS6中文版基礎培訓教程
- CorelDRAW X5實用教程(第2版)
- PowerPoint 2019從入門到精通(移動學習版)
- Illustrator平面設計立體化教程:Illustrator 2021(微課版)
- 中文版Photoshop 2020完全自學教程
- 中文版Photoshop CS6全能修煉圣經(移動學習版)
- Oracle Warehouse Builder 11g: Getting Started
- Visio圖形設計從新手到高手(兼容版)
- 金融精英PPT實操手冊:世界知名公司這樣展示研究報告
- Plone 3.3 Site Administration
- Photoshop+CorelDRAW平面設計實例教程(第3版)
- SilverStripe 2.4 Module Extension, Themes, and Widgets: Beginner's Guide
- CAXA CAD電子圖板和3D實體設計2021基礎入門一本通