官术网_书友最值得收藏!

技術對于商業影響加深


引發機器學習大爆炸的導火索

WHAT’S DRIVING THE MACHINE LEARNING EXPLOSION?

埃里克·布林約爾松( Erik Brynjolfsson) 安德魯·麥卡菲( Andrew McAfee) | 文

海量數據、算法進步和不斷提升的計算機硬件性能,這三大因素成就AI時代

在20世紀50年代,機器學習系統就誕生了,但問題是:為什么我們現在才突然看到AI在眾多領域的突破性發展?以下三個因素可說明癥結所在:數據大量增加;算法進步顯著;計算機硬件性能得到巨大提升。在過去20年中,應用軟件中的數據可用性增長1000倍,關鍵算法改進10到100倍,硬件速度至少提高100倍。麻省理工學院的托馬索·波吉奧(Tomaso Poggio)稱,正是因為以上所有進步,應用軟件才有了質的提升,比如自動駕駛汽車的行人檢測視覺系統。

現在我們來逐一了解這三大因素。數據。音樂CD、電影DVD和網頁這幾十年來豐富了全球數字編碼信息,而過去幾年里信息出現爆炸式增長。現在,我們接收的信號來自智能手機和工業設備的傳感器、數字照片和視頻、源源不斷的社交媒體信息流和其他很多應用軟件,數據的豐富程度前所未有。現在,世界上90%的數字數據都是過去兩年中涌現的。如今,物聯網的發展勢如破竹,數十億新裝置及其數據流將實現連接,所以,在接下來的10年中,我們勢必將處理更多數字數據。

算法。數據爆炸既讓現有算法變得更有效,還促進支撐并加快了更高級算法的開發,因此意義非凡。目前主宰這一領域的算法和做法(比如深度監督學習和增強學習)都有一個重要的共同點:其結果隨訓練數據的增加而提升。算法的表現到了一定高度后通常會趨于穩定,之后再輸入更多數據,也基本上沒有任何提升。但我們現在普遍使用的算法,很多都不會出現這種情況。此外,新算法可以在不同應用軟件中傳遞知識,所以需要學習的實例會越來越少。

計算機硬件。摩爾定律在2015年迎來了50周年,而且發展依然強勁。該定律指出,集成電路能力每隔18到24個月都會增加一倍。最近有人評論說,摩爾定律快要觸及物理學的極限,所以在接下來的幾年中發展會放緩;事實上標準微處理器的進化已經停滯。但一種與微處理器類似的計算機芯片,安裝在神經網絡的計算系統中時,恰恰能夠高效運行,這種芯片即圖形處理器(GPU)。實際上,神經網絡從傳統中央處理器轉移到GPU,很可能會提速10倍。最初開發GPU的目的是,加快電腦游戲等應用軟件的圖形顯示過程,從而實現規模生產、降低硬件成本。但現在GPU越來越多地用在神經網絡中,而隨著神經網絡應用軟件的進一步普及,一些公司甚至為這些應用開發專業芯片,比如谷歌的傳感器處理器,或塑性聚氨酯彈性體(TPU)。谷歌DeepMind聯合創始人尚恩·萊格(Shane Legg)稱,現在一個TPU一天處理的數據需要1990年的80486微處理器花25萬年才能處理完,這相當于速度又提升了10倍。

以上進步會產生協同效應。比如硬件升級有助于工程師測試、開發更好的算法,當然機器也得以在長時間內持續處理更大的數據組。現在,有些應用軟件的工作(如將語音轉化為有意義的文字)交給20世紀90年代的老式硬件做的話,幾乎要用好幾個世紀才能完成。這些進展激勵更多聰慧的研究人員加入AI行業,更多投資者和高管為深度研究提供資金。

全球網絡和云端技術進一步加強了協同效應。移動互聯網現在幾乎覆蓋了地球上任一地點,將數十億潛在客戶和重要AI技術連接起來。你可以想想目前正在使用的智能手機上的智能助手、大公司在全球范圍內分享的數字知識庫,以及維基百科和Kaggle等眾包系統(其主要用戶和貢獻者都來自組織之外)。

更重要的是,AI和機器學習搭載云技術后會進一步提升和擴散。比如,某一固定地點的機器人很難完成物體識別或其他任務。但一旦它學會執行這項任務后,就可以將知識上傳到云端,分享給其他使用同一知識表達系統的機器人(Rethink Robotics公司正在開發這樣的平臺)。這樣單獨作業的機器人就有了數百、數千,甚至數百萬眼睛和耳朵,并得以高效收集數據。機器人將所有信息整合到一個系統內,學習速度會顯著提高,洞見也幾乎能即時得到分享。

主站蜘蛛池模板: 清流县| 廊坊市| 苍山县| 郎溪县| 大渡口区| 准格尔旗| 南乐县| 开平市| 马尔康县| 高雄市| 荃湾区| 轮台县| 固原市| 安西县| 治多县| 湛江市| 九江市| 沂源县| 禹州市| 武隆县| 柘荣县| 新营市| 景泰县| 英吉沙县| 峨眉山市| 南靖县| 和林格尔县| 鸡泽县| 嘉禾县| 连山| 和田市| 江源县| 宜宾县| 徐汇区| 宜兰市| 建瓯市| 板桥市| 崇仁县| 桃园市| 枣庄市| 兰州市|