書名: 世界前沿技術(shù)發(fā)展報告2020作者名: 國務(wù)院發(fā)展研究中心國際技術(shù)經(jīng)濟研究所本章字數(shù): 5112字更新時間: 2020-08-10 18:04:52
五、人工智能
自2016年AlphaGo戰(zhàn)勝人類圍棋冠軍以來,人工智能技術(shù)受到各國高度重視。各國政府從政策規(guī)劃、資金投入和研發(fā)力量等各方面進行支持,推動底層算法和架構(gòu)技術(shù)升級,加速人工智能在安防、教育、醫(yī)療和交通等領(lǐng)域的應(yīng)用落地,人工智能產(chǎn)業(yè)規(guī)模得以大幅提升。2019年,科學家推動下一代人工智能技術(shù)研發(fā),強化人工智能的語言理解能力;人工智能在圖像視頻和語音識別領(lǐng)域的應(yīng)用進一步拓展;同時,以深度偽造技術(shù)為代表的人工智能造假技術(shù)擴散,給國家安全和社會治理帶來新風險與新隱患。
(一)基礎(chǔ)研究
在大數(shù)據(jù)、深度學習與計算能力大幅提升的背景下,人工智能已經(jīng)實現(xiàn)了相對簡單的感知智能,但仍處于初級階段。未來,推動人工智能與傳統(tǒng)產(chǎn)業(yè)的深度融合,實現(xiàn)人工智能在多個領(lǐng)域的規(guī)模化應(yīng)用,以及將人工智能深入應(yīng)用于人類生活,都需要加強人工智能基礎(chǔ)研究,從而突破機器認知能力的限制,促進科研與產(chǎn)業(yè)的深入探索,降低人工智能的應(yīng)用門檻,構(gòu)建完善的人工智能產(chǎn)業(yè)應(yīng)用發(fā)展體系。
1.美國加州大學伯克利分校開發(fā)出深度強化學習算法
2019年1月,美國加州大學伯克利分校和谷歌大腦項目的研究人員開發(fā)出一種穩(wěn)定的深度強化學習算法,該算法只需要適量的試驗和最小限度的參數(shù)調(diào)整,即可學習多層神經(jīng)網(wǎng)絡(luò)策略。該算法基于最大熵強化學習框架,能夠?qū)W習過程進行動態(tài)、自動調(diào)整。借助該算法,計算機可在兩小時內(nèi)完成對四足機器人運動步態(tài)的學習。
2.DARPA啟動多個人工智能研究項目
2019年1月,DARPA啟動“微尺度仿生魯棒人工智能網(wǎng)絡(luò)項目”,對昆蟲進行仿生研究以改進人工智能系統(tǒng)。DARPA 希望該項目通過模仿昆蟲大腦,改善現(xiàn)有人工智能系統(tǒng)神經(jīng)形態(tài)和神經(jīng)架構(gòu)依賴數(shù)字計算的情況,從而縮短人工智能訓練時間,提高計算效率并降低功耗。
2019年1月,DARPA啟動“知識導向的人工智能推理模式”項目,希望利用人工智能對復雜的現(xiàn)實世界事件進行語境和時間推理,生成對這些事件的解讀,并預測這些事件將如何展開。該項目將開發(fā)一個半自動化系統(tǒng),以識別看似無關(guān)的事件或數(shù)據(jù)之間的相關(guān)性并繪制關(guān)系圖譜,幫助人們迅速理解事件對國家安全工作的影響。
2019年3月,DARPA啟動“基于理解的人工智能語言習得”項目,旨在構(gòu)建能夠理解話語含義的人工智能工具,使它運用邏輯和推理能力進行語言學習與表達。DARPA 希望通過對人工智能語言系統(tǒng)語言習得方式的研究,建立一個自動語言習得模型,使人工智能語言系統(tǒng)能夠像人類孩童一樣,在觀察外部環(huán)境的同時學習語言。DARPA 還計劃利用該項目開發(fā)一個原型,將文本或語音輸入與圖像、視頻或先前未見過的實體、動作的虛擬視覺場景關(guān)聯(lián)起來,并生成事件和關(guān)系的英文描述,從而訓練人工智能系統(tǒng)的語言習得能力。
3.美國北卡羅來納州立大學開發(fā)出新型深度神經(jīng)網(wǎng)絡(luò)框架
2019年5月,美國北卡羅來納州立大學開發(fā)出新型深度神經(jīng)網(wǎng)絡(luò)框架。該框架可使人工智能系統(tǒng)在更好地學習新任務(wù)的同時,保留其在之前任務(wù)中學到的東西,以便更好地執(zhí)行新任務(wù)和舊任務(wù)。研究人員對比其他神經(jīng)網(wǎng)絡(luò)框架發(fā)現(xiàn),新框架下的人工智能系統(tǒng)經(jīng)過培訓后,在執(zhí)行新任務(wù)時幾乎不會忘記執(zhí)行舊任務(wù)所需的內(nèi)容,且在完成新任務(wù)時具有更高的準確性。該項研究由美國陸軍資助完成,有望用于軍隊人工智能系統(tǒng)。
4.美國空軍與美國麻省理工學院合作開展人工智能研究
2019年5月,美國空軍宣布與麻省理工學院簽訂合同,擬通過推動計算智能、推理、決策、自主和相關(guān)社會影響的基礎(chǔ)研究加速人工智能技術(shù)研發(fā)。美國空軍計劃與美國麻省理工學院建立50年的合作關(guān)系,每年投資約1500萬美元。根據(jù)合同,研發(fā)團隊成員將包括11名美國空軍飛行員,主要目的是為“實際的國家安全挑戰(zhàn)”提供實用的人工智能解決方案。研究團隊將致力于研究決策支持、維護和后勤、人才管理、醫(yī)療準備、態(tài)勢感知、商務(wù)和救災(zāi)等多個人工智能項目。
5.美國計算社區(qū)聯(lián)盟發(fā)布《未來20年美國人工智能研究團體路線圖》草案
2019年6月,美國計算社區(qū)聯(lián)盟(Computing Community Consortium,CCC)發(fā)布《未來 20年美國人工智能研究團體路線圖》草案。該路線圖是在咨詢研究人員和科技公司之后制定的,旨在呼吁聯(lián)邦政府持續(xù)提供支持,以確保美國在一些最先進的人工智能資源方面保持全球領(lǐng)先地位。該路線圖提出的建議有構(gòu)建開放性人工智能平臺、啟動全國人工智能競賽、成立國家級研究中心和人工智能實驗室、支持自知學習的研究及啟動人才招募計劃等。
6.美國聯(lián)合研究團隊開發(fā)出新型人機交互對話系統(tǒng)
2019年7月,美國紐約州立大學賓漢姆頓分校(State University of New York at Binghamton)、美國克利夫蘭州立大學(Cleveland State University)和美國華盛頓大學的聯(lián)合研究團隊開發(fā)出新型人機交互對話系統(tǒng),該系統(tǒng)可通過自我學習提高理解能力。機器人借助語言理解、對話管理、知識管理和語言生成4個模塊,能夠在與人類的對話中學習、理解語義。研究人員將開展后續(xù)研究,使機器人能夠完成交付包裹等實際任務(wù),同時學習周圍環(huán)境中的新概念。
(二)圖形圖像處理
近年來,人工智能技術(shù)在圖形圖像處理與識別領(lǐng)域大范圍應(yīng)用,并且取得極大的成功。智能圖像處理與識別從早期在軍事和科研領(lǐng)域的小范圍應(yīng)用,發(fā)展至今已經(jīng)廣泛應(yīng)用到智慧城市、醫(yī)療、交通、安防、農(nóng)業(yè)、工業(yè)和娛樂等各行各業(yè),其中人臉識別和深度偽造技術(shù)更是在全球范圍內(nèi)獲得關(guān)注。
1.日本電氣股份有限公司開發(fā)出新型面部識別技術(shù)
2019年2月,日本電氣股份有限公司開發(fā)出新型面部識別技術(shù),該技術(shù)可識別面部模糊部分,甚至面向其他方向的人臉。該技術(shù)名為“人物再識別技術(shù)”,結(jié)合使用深度學習、身體形狀及衣服分析技術(shù),在測試過程中實現(xiàn)了高達90%的準確率。該技術(shù)可用于全身識別而不僅是面部識別,有望在人群中或存在大量視覺障礙物區(qū)域等場景中部署以進行身份識別。
2.谷歌研發(fā)出可大幅提升圖像生成效率的新技術(shù)
2019年3月,谷歌的研究人員提出了一種基于自監(jiān)督和半監(jiān)督學習的“條件生成式對抗網(wǎng)絡(luò)”,該技術(shù)可使圖像生成需要使用的標記數(shù)據(jù)量降低90%,且生成的圖像的質(zhì)量比現(xiàn)有全監(jiān)督最優(yōu)模型高20%。研究人員將高保真自然圖像合成技術(shù)與最先進的大規(guī)模生成式對抗網(wǎng)絡(luò)技術(shù)相結(jié)合,大幅提升圖像生成的效率,該技術(shù)有望緩解圖像生成和識別領(lǐng)域標記數(shù)據(jù)量嚴重不足的問題。
3.三星利用有限的數(shù)據(jù)集即可制作出高仿真度虛假視頻
2019年5月,三星人工智能中心研發(fā)出一種新方法,通過該方法,研究人員利用有限的訓練數(shù)據(jù)集即可制作出高仿真度虛假視頻。受技術(shù)水平限制,要想讓深度偽造視頻達到令人信服的效果,需要采用大量的數(shù)據(jù)集并對模型進行反復訓練。研究人員從YouTube上收集了7000張名人照片,從中提取出臉部、眼睛、嘴巴等標志性面部特征用于訓練算法,最終利用該算法成功制作出高仿真度的虛假視頻。研究人員將這種算法應(yīng)用至單一照片,亦能生成難辨真?zhèn)蔚娜宋飯D像。
4.英國布拉德福德大學面部識別技術(shù)取得突破性進展
2019年5月,英國布拉德福德大學(University of Bradford)研究的面部識別技術(shù)取得突破性進展,可對遮蓋1/4甚至1/2的面部進行精準識別。研究人員采用卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)開發(fā)新型面部識別技術(shù),使用余弦相似度和線性支持向量機測試識別率,在兩個公開可用的人臉數(shù)據(jù)集上進行了試驗。試驗結(jié)果表明,該架構(gòu)掃描整個面部的3/4甚至1/2時的識別準確率能夠達到100%。研究人員表示,此項突破有望推動人臉識別技術(shù)應(yīng)用于安防或預防犯罪等領(lǐng)域。
5.美國麻省理工學院與美國IBM公司合作開發(fā)出可創(chuàng)建虛假照片的人工智能工具
2019年7月,美國麻省理工學院與美國IBM公司的研究人員合作開發(fā)出能夠生成虛假圖像的人工智能工具GANpaint Studio。該工具經(jīng)過神經(jīng)網(wǎng)絡(luò)訓練后,能夠掌握物體之間歸屬關(guān)系的簡單規(guī)則,可在圖像內(nèi)生成虛假對象或除去對象。研究人員表示,對GANpaint Studio學習機制的研究還將有助于圖片鑒偽工作的開展。
6.德國波茨坦大學研發(fā)出通過眼球運動識別人類身份的方法
2019年7月,德國波茨坦大學(Potsdam University)的研究人員開發(fā)出一種新的生物識別方法,研究人員可通過人工智能分析眼球微觀運動以識別人類身份。研究人員使用深度學習方法訓練計算機識別人類無意識的眼動行為,使識別更為精準、破解難度更高。該研究有望大幅提高生物特征識別的安全性。
7.美國加州大學河濱分校開發(fā)出用于識別深度偽造圖像和視頻的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)
2019年7月,美國加州大學河濱分校(University of California,Riverside)的研究人員開發(fā)出一種深度神經(jīng)網(wǎng)絡(luò)架構(gòu),該神經(jīng)網(wǎng)絡(luò)架構(gòu)可用于識別使用深度偽造技術(shù)制作的圖像和視頻。該神經(jīng)網(wǎng)絡(luò)架構(gòu)可通過檢測圖像內(nèi)元素的不自然特征,識別出修改過的圖像。研究人員表示,盡管技術(shù)進步能夠推動鑒偽工作的開展,但造偽技術(shù)的升級使鑒偽工作無法完全實現(xiàn)自動化,識別偽造的圖像和視頻仍存在難度。
8.美國智能追蹤公司正在開發(fā)新型追蹤技術(shù),以減小對面部識別的依賴
2019年8月,美國智能追蹤公司(Traces AI)正在開發(fā)新型追蹤技術(shù),該技術(shù)使用多種個人特征識別身份,能夠降低對面部識別的依賴。研究人員表示,傳統(tǒng)監(jiān)視器跟蹤技術(shù)過于依賴人臉識別,可能會侵犯到公眾的隱私。Traces AI研究的識別技術(shù)不過度關(guān)注人臉,而是依賴個人的其他物理屬性,如衣服、發(fā)型和肢體語言等進行識別。Traces AI希望新型追蹤技術(shù)能替代政府機構(gòu)執(zhí)法過程中采用的人臉識別技術(shù),以最大限度地保護公眾隱私。此外,不依賴人臉識別的追蹤技術(shù)也可減少計算機系統(tǒng)造成的種族歧視。
9.美國南加州大學和美國加州大學伯克利分校研發(fā)出可識別出DeepFakes虛假視頻的人工智能工具
2019年9月,美國南加州大學(University of Southern California)和美國加州大學伯克利分校的研究人員合作研發(fā)出可識別出深度偽造視頻的新人工智能工具,其識別準確率達到92%。該工具可通過訓練確定每個人講話或做表情時面部各器官的特定細節(jié)動作,由此識別出偽造視頻。研究人員還計劃通過識別人聲的獨特節(jié)奏和特征,進一步提高人工智能識別虛假視頻的成功率。
(三)語音處理與識別
人工智能技術(shù)的進步推動了語音處理與識別的快速發(fā)展,使得語音處理與識別成為人工智能應(yīng)用最廣泛的領(lǐng)域之一。語音處理與識別技術(shù)與人工智能結(jié)合,不僅能夠?qū)崿F(xiàn)機器的語音合成、對語音的自動識別和發(fā)音人的自動辨識,還可以實現(xiàn)各種語句的自動識別甚至語言的自動理解,助推人機語音交互應(yīng)答系統(tǒng)的誕生,并有望將腦信號直接轉(zhuǎn)換為語音,進一步推動人機智能交互技術(shù)的進步。
1.美國哥倫比亞大學和德國不來梅大學等嘗試利用人工智能破譯大腦語言信號
2019年1月,美國哥倫比亞大學和德國不來梅大學(Universit?t Bremen)等組成的科研團隊,嘗試利用人工智能破譯大腦語言信號。研究人員結(jié)合深度學習和語音合成技術(shù),使用大腦數(shù)據(jù)訓練人工智能系統(tǒng),可以將大腦活動數(shù)據(jù)轉(zhuǎn)換成語音。研究人員在受試者大聲朗讀、默念或聽錄音時監(jiān)控大腦活動并采集數(shù)據(jù),再把收集到的大腦信號轉(zhuǎn)換成人類能夠理解的單詞和簡單句,準確率為40%~80%。
2.日本東芝開發(fā)出可將語音轉(zhuǎn)換成簡潔文字的技術(shù)
2019年3月,日本東芝(Toshiba)開發(fā)出的新技術(shù)可利用人工智能,立即將會議及演講的語音轉(zhuǎn)換成易于閱讀的文字,并通過字幕顯示出來。相較以往的語音轉(zhuǎn)換技術(shù)而言,該技術(shù)除了能識別話語中的停頓等,還能通過預測接下來出現(xiàn)的詞語,將口語中無意義的詞語刪除,將語音轉(zhuǎn)換成簡潔的文字。日本東芝表示,該技術(shù)將幫助聽覺障礙人士更好地獲得信息。
3.美國加州大學舊金山分校開發(fā)出可將人腦活動轉(zhuǎn)換為語音的新技術(shù)
2019年4月,美國加州大學舊金山分校(University of California,San Francisco)的研究人員開發(fā)出可將人腦活動轉(zhuǎn)換為語音的新技術(shù)。研究人員研發(fā)出一套人類語音合成系統(tǒng),該系統(tǒng)通過解碼與人類下頜、喉頭、嘴唇和舌頭動作相關(guān)的腦信號,合成受試者想要表達的語音。研究人員在語音合成系統(tǒng)中設(shè)計了一種神經(jīng)解碼器,該解碼器利用人類皮層活動中編碼的運動學和聲音表征合成語音,首先將神經(jīng)信號轉(zhuǎn)換成聲道咬合部位的運動,再將聲道咬合部位的運動轉(zhuǎn)換成合成語音,大大降低了合成語音的失真率。目前該技術(shù)每分鐘最多可轉(zhuǎn)換 10 個單詞,遠低于普通人每分鐘150字的正常說話速度。研究人員表示,他們將通過收集更大的數(shù)據(jù)集和開發(fā)基礎(chǔ)計算方法進一步改善語音合成系統(tǒng)。
4.微軟和浙江大學聯(lián)合推出新型高速語音合成模型FastSpeech
2019年6月,微軟和浙江大學聯(lián)合推出一種利用神經(jīng)網(wǎng)絡(luò)技術(shù)的新型高速語音合成模型FastSpeech,大大提高了語音合成效率。傳統(tǒng)的基于神經(jīng)網(wǎng)絡(luò)的端到端文本語音轉(zhuǎn)換模型,通常首先從文本中生成梅爾頻譜(Mel-Spectrogram),然后使用波網(wǎng)(WaveNet)等聲碼器從梅爾頻譜中合成語音,但其存在推理速度較慢、合成語音不穩(wěn)健、缺乏可控性等缺點。FastSpeech屬于前饋網(wǎng)絡(luò)模型,可將梅爾頻譜的生成速度提高近270倍,幾乎完全消除了合成語音中重復吐詞和漏詞問題,而且可以平滑地調(diào)整語音速度和控制停頓,以部分提升韻律。
5.加拿大皇后大學開發(fā)出語音識別人工智能工具
2019年7月,加拿大皇后大學(Queen’s University)開發(fā)出深度神經(jīng)網(wǎng)絡(luò)架構(gòu)UtterldNet,UtterldNet可利用短語音片段識別說話者身份。研究人員使用語音數(shù)據(jù)集對UtterldNet進行訓練和測試,使其能夠快速識別短語音片段中的特征。該人工智能工具能夠憑借1秒甚至更短的語音片段判斷說話者身份,且性能穩(wěn)定,為語音識別技術(shù)的深入探索鋪平了道路。
- 新型智庫共建“一帶一路”的創(chuàng)新實踐:藍迪國際智庫報告.2019=Innovative Practice of B&R Construction:RDI Annual Report 2019:英文
- 農(nóng)民工怎樣成為城里人
- 中國地質(zhì)精神論
- 人類學家是做什么的(人文智慧譯叢)
- 新時代中國馬克思主義文藝理論的創(chuàng)新與發(fā)展:全國馬列文論研究會學術(shù)年刊(2023年卷)
- 上海購買社區(qū)矯正社會工作服務(wù)十年實踐與探索
- 走在祖國大地上:北大選調(diào)生的基層治理實踐(上冊)
- 改革開放與當代中國智庫
- 2020中國戰(zhàn)“疫”日志
- 中國學術(shù)思想史綱要
- 公正履行檢察職能的改革探索
- 再造異同:人類學視域下的整合模式
- 從制度看政府公信力
- 新時代人才觀視域下海外人才回流影響因素研究:以電力行業(yè)博士為例
- 領(lǐng)導力讓世界更美好:理解領(lǐng)導力發(fā)展的社會變革模式