官术网_书友最值得收藏!

  • 深度學習
  • (美)特倫斯·謝諾夫斯基
  • 14478字
  • 2019-03-15 11:05:01

01
機器學習的崛起

不久之前,人們還常說,計算機視覺的辨別能力尚不如一歲大的孩子。如今看來,這句話要改寫了。計算機不僅能和大多數成年人一樣識別圖片中的物體,在馬路上駕駛汽車的安全性還高過16歲的青少年。更神奇的是,如今的計算機不再是被動按照指令識別和駕駛,而是像自然界的生命由數百萬年前開始進化那樣,自主地從經驗中學習。是數據的井噴促成了這一技術進步。如果說數據是新時代的石油,那么學習算法就是從中提取信息的煉油廠;信息積累成知識;知識深化成理解;理解演變為智慧。歡迎來到深度學習的新世界。“啊,美麗的新世界,有這么美的人在里頭!”(“O brave new world that has such people in’t!”)來自莎士比亞的劇作《暴風雨》中米蘭達的臺詞(5.1.182–183 [Oxford Standard Authors Shakespeare])。

深度學習是機器學習的一個分支,它根植于數學、計算機科學和神經科學。深度網絡從數據中學習,就像嬰兒了解周圍世界那樣,從睜開眼睛開始,慢慢獲得駕馭新環境所需的技能。深度學習的起源可以追溯到20世紀50年代人工智能的誕生。關于如何構建人工智能,當時存在兩種不同的觀點:一種觀點主張基于邏輯和計算機程序,曾主宰人工智能的研究和應用數十年;另一種觀點則主張直接從數據中學習,經歷了更長時間的摸索才逐漸成熟。

20世紀,計算機技術還不夠成熟,而且按照現在的標準,數據存儲成本十分高昂,用邏輯程序來解決問題更加高效。熟練的程序員需要為每個不同的問題編寫不同的程序,問題越大,相應的程序也就越復雜。如今,計算機能力日趨強大,數據資源也變得龐大且豐富,使用學習算法解決問題比以前更快、更準確,也更高效。此外,同樣的學習算法還能用來解決許多不同的難題,這遠比為每個問題編寫不同的程序更加節省人力。

汽車新生態:無人駕駛將全面走入人們生活

在2005年美國國防部高級研究計劃局(以下簡稱DARPA)舉辦的自動駕駛挑戰賽中,一輛由斯坦福大學塞巴斯蒂安·特?。⊿ebastian Thrun)實驗室開發的自動駕駛汽車Stanley最終贏得了200萬美元現金大獎(見圖1–1)。團隊利用了機器學習技術教它如何自主地在加利福尼亞州的沙漠中穿行。132英里的賽道中有若干狹窄的隧道和急轉彎,還包括啤酒瓶道(Beer Bottle Pass),這是一段蜿蜒曲折的山路,兩側分別是碎石遍布的陡坡和斷壁(見圖1–2)。特隆并沒有遵循傳統的AI方法,即通過編寫計算機程序來應付各種偶發事件,而是在沙漠中駕駛Stanley,讓汽車根據視覺和距離傳感器的感應輸入,學習如何像人一樣駕駛。

圖1-1 塞巴斯蒂安·特隆及其團隊的自動駕駛汽車Stanley在2005年贏得了DARPA舉辦的自動駕駛挑戰賽。這項突破引發了交通界的技術革命。圖片來源:塞巴斯蒂安·特隆。

圖1-2 啤酒瓶道。這段極具挑戰性的地形位于2005年DARPA自動駕駛挑戰賽的末段。該賽事要求汽車在無人輔助的情況下駛過132英里的沙漠荒路。圖中遠處的一輛卡車正要爬坡。圖片來源:DARPA。

特隆后來參與創立了高科技項目重點實驗室Google X,并開始了進一步研究自動駕駛汽車技術的計劃。谷歌的自動駕駛汽車自此開始,在舊金山灣區累積了350萬英里的車程。優步(Uber)已經在匹茲堡投放了一批自動駕駛汽車。蘋果也步入自動駕駛領域,以擴大其操作系統控制的產品范圍,并希望能夠再現它在手機市場上的輝煌。汽車制造商們親眼看見一個100年來從未改變的行業在他們眼前發生了轉型,也開始奮起直追。通用汽車公司以10億美元的價格并購了開發無人駕駛技術的硅谷創業公司Cruise Automation,并在2017年投入了額外的6億美元用于研發。Bill Vlasic, “G.M. Wants to Drive the Future of Cars That Drive Themselves,” NewYork Times, June 4, 2017, https://www.nytimes.com/2017/06/04/business/generalmotors-self-driving-cars-mary-barra.html.2017年,英特爾以153億美元的價格收購了Mobileye,它是一家專門為自動駕駛汽車研發傳感器和計算機視覺的公司。在價值數萬億美元的交通運輸領域,參與的各方都下了極高的賭注。

自動駕駛汽車不久將擾亂數百萬卡車司機和出租車司機的生計。最終,如果一輛自動駕駛汽車能夠在一分鐘內出現,將你安全帶到目的地且無須停車,在城市擁有汽車就顯得不那么必要了。今天,汽車行駛時間平均僅占4%,這意味著它其余96%的時間都需要停放在某個地方。由于自動駕駛汽車可以在城市外圍維修和停放,城市中被大量停車場占用的空間得以被重新高效利用。城市規劃者已經開始考慮讓停車場變成公園了。“Full Tilt: When 100% of Cars Are Autonomous,” New York Times Magazine, November 8, 2017, https://www.nytimes.com/interactive/2017/11/08/magazine/tech-design-autonomous-future-cars-100-percent-augmented-realitypolicing.html?hp&action=click&pgtype=Homepage&clickSource=storyheading&module=second-column-region&region=top-news&WT.nav=top-news/.街邊的停車道可以成為真正的自行車道。其他汽車相關行業也將受到影響,包括汽車保險業和修理廠。超速和停車罰單將不復存在。由醉駕和疲勞駕駛導致的交通事故死亡人數也會相應減少。通勤浪費的時間也將被節省下來做其他事情。根據2014年的美國人口普查數據,1.39億上班族人均單日通勤時間達到了52分鐘,全年總計296億小時。這驚人的340萬年的時間本可以在人生中得到更好的利用。Christopher Ingraham, “The Astonishing Human Potential Wasted on Commutes,”Washington Post, February 24, 2016, https://www.washingtonpost.com/ news/wonk/wp/2016/02/25/how-much-of-your-life-youre-wasting-on-your-commute/?utm_term=497dfd1b5d9c..自動駕駛汽車會使公路通行能力翻兩番。“Full Tilt: When 100% of Cars Are Autonomous,” New York Times Magazine,November 8, 2017, https://www.nytimes.com/interactive/2017/11/08/magazine/tech-design-autonomous-future-cars-100-percent-augmented-realitypolicing.html ?hp&action=click&pgtype=Homepage&clickSource=storyheading&module=second-column-region&region=top-news&WT.nav=top-news/.而且,一旦大規模投入使用,沒有方向盤、可以自己開回家的自動駕駛汽車還會讓大規模汽車盜竊行為銷聲匿跡。雖然目前自動駕駛汽車仍面臨很多監管和法律層面的障礙,但這一技術一旦開始普及,我們就將迎來一個嶄新的世界。可以預見的是,卡車大概會在10年內率先實現自動駕駛,出租車要花上15年,而15到25年后,客運無人車將全面走入人們的生活。

汽車在人類社會中的標志性地位將以我們無法想象的方式發生變化,一種新的汽車生態也將應運而生。正如100多年前汽車的出現創造了許多新的行業和就業機會,圍繞著自動駕駛汽車的發展,也出現了一個快速增長的生態系統。從谷歌獨立出來的自動駕駛公司Waymo,8年來已經投入了10億美元,并在加州中部山谷搭建了一個秘密測試場所。該場所位于一個占地91英畝的仿造小鎮,其中還設計了騎自行車的“演員”和假的汽車事故。“Google’s Waymo Passes Milestone in Driverless Car Race,” Financial Times,December 10, 2017, https://www.ft.com/content/dc281 ed2-c425-11 e7-b2bb322b2cb39656/.其目的是擴大訓練數據集以包含特殊和不常見的情況(也叫邊緣情況)。公路上罕見的駕駛事件經常會導致事故。自動駕駛汽車的不同之處就在于,當一輛汽車遇到罕見事件時,相應的學習體驗會被傳遞給所有其他自動駕駛汽車,這是一種集體智能。其他自動駕駛汽車公司也在建造許多類似的測試設施。這些舉措創造了以前并不存在的新工作機會,以及用于汽車導航的傳感器和激光器的新供應鏈。B. A. Golomb, “Will We Recognize It When It Happens?” in Brockman, J., (ed.),What to Think About Machines That Think(New York: Harper Perennial, 2015),533– 535.

自動駕駛汽車僅是信息技術推動經濟發生重大轉變的一個最明顯的體現。網絡上的信息流就像城市管道里的水流。信息在谷歌、亞馬遜、微軟和其他IT公司的大型數據中心聚集。這些數據中心需要耗費大量電力,因此通常建在水電站附近,并利用河水來冷卻信息流所產生的大量熱量。2013年,美國的數據中心消耗了1000萬兆瓦的電量,相當于34個大型電廠產生的電力。Pierre Delforge, “America’s Data Centers Consuming and Wasting Growing Amounts of Energy,” Natural Resources Defense Council Issue Paper, February 6, 2015, https://www.nrdc.org/resources/americas-data-centers-consuming-andwasting-growing-amounts-energy/.但是目前對經濟影響更大的是如何使用這些信息。從原始數據中提取出的信息被轉化為關于人和事的知識:我們做什么,我們想要什么,我們是誰。計算機驅動的設備也在越來越多地利用這些知識與我們進行口頭上的交流。與大腦之外、書本之中的被動知識不同,儲存在云中的知識是一種外部智能,并且正在成為人們生活中積極、活躍的一部分。W. Brian Arthur, “Where Is Technology Taking the Economy?” McKinsey Quarterly,October, 2017, https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/Where-is-technology-taking-the-economy/.

自然語言翻譯:從語言到句子的飛躍

如今,谷歌在超過100種服務中使用了深度學習,包括街景視圖(Street View)、收件箱智能回復(Inbox Smart Reply)和語音搜索。幾年前,谷歌的工程師意識到他們需要將這些計算密集型應用擴展到云端。他們開始著手設計一種用于深度學習的專用芯片,并巧妙地設計了可以插入數據中心機架中的硬盤插槽的電路板。谷歌的張量處理單元(TPU)現在已配置在遍布全球的服務器上,讓深度學習應用程序的性能得到了大幅改進。

深度學習快速改變格局的一個例子是它對語言翻譯的影響。語言翻譯是人工智能的一只圣杯,因為它依賴于理解句子的能力。谷歌最近推出了基于深度學習的最新版谷歌翻譯(Google Translate),代表了自然語言翻譯質量的重大飛躍。幾乎一夜之間,語言翻譯就從零散雜亂的拼湊短語,升級到了語意完整的句子(見圖1–3)。之前的計算機方法搜索的是可以被一并翻譯的詞匯組合,但深度學習會在整個句子中尋找詞匯之間的依賴關系。

圖1-3 手機上的谷歌翻譯應用可以將日語文字和菜單即時譯成英文。這一功能對于在日本如何按照指示牌乘車尤為重要。

得知谷歌翻譯獲得了巨大進步的消息后,2016年11月18日,東京大學的暦本純一(Jun Rekimoto)測試了這個新系統。他把歐內斯特·海明威的小說《乞力馬扎羅的雪》開頭的一段話翻譯成了日文,然后再把這段日文翻譯成英文,結果如下(猜猜哪個是海明威的原作):

1. Kilimanjaro is a snow-covered mountain 19,710 feet high,and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.乞力馬扎羅山是一座雪山,高19 710英尺,據說是非洲最高的山峰。它的西峰被馬賽人稱作“Ngaje Ngai”,意為“上帝的家”??拷鞣逵幸痪吒稍铩⒈鶅龅谋邮w。沒有人解釋過這只豹子在那個高度是要尋找什么。

2. Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.乞力馬扎羅山是一座高達19 710英尺的雪山,據說是非洲最高的山峰。它的西峰在馬賽語里被稱為“Ngaje Ngai”,上帝的家。西峰附近有一具干燥、冷凍的豹子尸體。從來沒有人解釋過豹子在那個高度想要找什么。Gideon Lewis-Kraus, “The Great A. I. Awakening,” New York Times Magazine,December 14, 2016, https://www.nytimes.com/2016/12/14/magazine/the-greatai-awakening.html.

海明威的原作是第一段。

下一步工作是訓練更大規模的深度學習網絡,針對段落來提高句子間的連貫性。文字背后都有悠久的文化歷史。俄裔作家和英文小說家,《洛麗塔》一書的作者弗拉基米爾·納博科夫(Vladimir Nabokov)曾經得出結論,在不同語言之間翻譯詩歌是不可能的。他將亞歷山大·普希金(Aleksandr Pushkin)的詩體小說《葉甫蓋尼·奧涅金》(Eugene Onegin)直譯成了英文,并對這些詩文的文化背景做了解釋性腳注,以此論證他的觀點。Aleksandr Sergeevich Pushkin, Eugene Onegin: A Novel in Verse, 2nd ed., trans.Vladimir Nabokov (Princeton: Princeton University Press, 1991).或許谷歌翻譯終有一天能夠通過整合莎士比亞的所有詩歌來翻譯他的作品。關于這一做法的早期嘗試,請參閱Andrej Karpathy, “The Unreasonable Effecti-veness of Recurrent Neural Networks,” Andrej Karpathy Blog, posted May 21, 2015, http://karpathy.github.io/2015/05/21/rnn-effectiveness/.

語音識別:實時跨文化交流不再遙遠

人工智能的另一只圣杯是語音識別。不久之前,計算機的獨立語音識別應用領域還很有限,如機票預訂。而如今,限制已不復存在。2012年,一名來自多倫多大學的實習生在微軟研究院(Microsoft Research)的一個夏季研究項目中,讓微軟的語音識別系統性能得到了顯著的提升(圖1–4)。G. Hinton, L. Deng, G. E. Dahl, A. Mohamed, N. Jaitly, A. Senior, et al., “Deep Neural Networks for Acoustic Modeling in Speech Recognition,” IEEE SignalProcessing Magazine29, no. 6 (2012): 82–97.2016年,微軟的一個團隊宣布,他們開發的一個擁有120層的深度學習網絡已經在多人語音識別基準測試中達到了與人類相當的水平。W. Xiong, J. Droppo, X. Huang, F. Seide, M. Seltzer, A. Stolcke, et al., “Achieving Human Parity in Conversational Speech Recognition,” Microsoft Research Technical Report MSR-TR-2016-71, revised February 2017, https://arxiv.org/pdf/1610.05256.pdf.

圖1-4 微軟首席研究官里克·拉希德(Rick Rashid)在2012年10月25日于中國天津舉行的一場活動中,使用深度學習進行了自動語音識別的現場演示。在2000名中國觀眾面前,拉希德說的英文被自動化系統識別,先在他的屏幕圖像下方顯示出英文字幕,隨后被翻譯成了中文。此次高難度展示被全球媒體爭相報道。圖片來源:微軟研究院。

這一突破性成果將在之后的幾年逐漸影響我們的社會,計算機鍵盤會被自然語言接口取代。隨著數字助手,如亞馬遜的Alexa、蘋果的Siri以及微軟的Cortana先后進入千家萬戶,這種取代已經在發生了。就如隨著個人電腦的普及,打字機退出了歷史舞臺,有一天電腦鍵盤也將成為博物館的展品。

當語音識別和語言翻譯結合到一起時,實時的跨文化交流將有可能實現?!缎请H迷航》中那種萬能翻譯機將觸手可及。為什么計算機語音識別和語言翻譯達到人類的水平要花這么久的時間?難道計算機的各種認知能力同時進入瓶頸期僅僅是巧合嗎?其實所有這些突破都源于大數據的出現。

AI醫療:醫學診斷將更加準確

深入皮膚

隨著機器學習的成熟并被應用于可獲取大數據的許多其他問題,服務行業和其相關職業也將發生轉變?;跀蛋偃f患者病情記錄的醫學診斷將變得更加準確。最近的一項研究將深度學習運用到了囊括超過2000種不同疾病的13萬張皮膚病學圖像中,這個醫學數據庫是以前的10倍大(圖1–5)。A. Esteva, B. Kuprel, R. A. Novoa, J. Ko J, S. M. Swetter, H. M. Blau, and S.Thrun, “Dermatologist-Level Classification of Skin Cancer with Deep Neural Networks,” Nature542, no. 7639 (2017): 115–118.該研究的網絡被訓練用于診斷“測試集”(testset,它從未見過的新圖像集)中的各種疾病。它在新圖像上的診斷表現與21位皮膚科專家的結論基本一致,甚至在某些情況下還要更準確。在不久的將來,任何一個擁有智能手機的人都可以拍下疑似皮膚病變的照片,并立即進行診斷——而現在要完成同樣的過程,我們需要先去看醫生,耐心等待病變被專家篩查出來,然后再支付一大筆賬單。這一進步將大大擴大皮膚病護理的范圍,提升護理質量。如果個體可以很快得到專家診斷,他們會在皮膚病的早期階段,也就是更容易治療的時候就開始就醫。借助深度學習,所有的醫生都將更準確地診斷罕見的皮膚病。Siddhartha Mukherjee, “A.I. versus M.D.: What Happens When Diagnosis Is Automated?” New Yorker, April 3, 2017, http://www.newyorker.com/magazine/2017/04/03/ai-versus-md/.

圖1-5 藝術家繪制的高準確度診斷皮膚病變的深度學習網絡圖,2017年2月2日《自然》雜志封面。

深入癌癥

如果專家在轉移性乳腺癌的淋巴結活檢切片圖像上判斷錯誤,就有可能導致致命的后果。這是一種深度學習擅長的模式識別問題。實際上,一個經過大量結論清晰的切片數據訓練出來的深度學習網絡能達到0.925的準確度,還不錯,但還不及人類專家在同一測試集上達到的0.966。Dayong Wang, Aditya Khosla, Rishab Gargeya, Humayun Irshad, Andrew H. Beck,Deep Learning for Identifying Metastatic Breast Cancer, arXiv:1606.05718. 他們使用的測量方法在信號檢測理論里被稱為“曲線下面積”,它對假陰性和假陽性都很敏感。https://arxiv.org/abs/1606.05718/.然而,把深度學習與人類專家的預測結合起來,準確度達到了0.995,幾近完美。由于深度學習網絡和人類專家查看相同的數據的方式不同,二者相結合的效果比單獨預測要好。這樣一來,更多的生命得以被挽救。這表明在未來,人類與機器將是合作而非競爭的關系。

深入睡眠

如果你有嚴重的睡眠問題(70%的人一生中都會遇到這個問題),你要等待幾個月才能見到你的醫生(除非問題十分緊急),然后你會被轉到一個睡眠診所。在那里,你需要在身上接幾十個能在你入睡時記錄你的腦電圖(EEG)和肌肉活動的電極,接受徹夜觀察。每個晚上,你會先進入慢波睡眠,然后定期進入快速眼動(REM)睡眠,在此期間,你會做夢,但是失眠、睡眠呼吸暫停綜合征、不寧腿綜合征以及許多其他睡眠障礙會干擾這種睡眠模式。如果你在家里就很難入睡,那么在一張陌生的床上,全身接滿了讓人不安的醫療設備進入睡眠狀態,絕對算得上真正的挑戰。睡眠專家會查看你的腦電圖記錄,以30秒為單位標記睡眠階段,一段8小時的睡眠要花幾個小時才能標記完。而最終你會得到一份有關睡眠模式異常情況的報告,以及一份2000美元的賬單。

依據1968年由安東尼·雷希特施芬(Anthony Rechtshaffen)和艾倫·卡萊斯(Alan Kales)設計的系統,睡眠專家將接受尋找表征不同睡眠階段特征跡象的培訓。Anthony Rechtschaffen and Alan Kales, eds., A Manual of StandardizedTerminology, Techniques and Scoring System for Sleep Stages of Human Subjects,National Institutes of Health publication no. 204 (Bethesda, MD: U.S. National Institute of Neurological Diseases and Blindness, Neurological Information Network, 1968).但是由于這些特征常常不明確,也不一致,只有75%的情況下專家們能在數據解讀上達成一致。相比之下,我實驗室之前的一名研究生菲利普·洛(Philip Low)使用無監督機器學習,花了不到一分鐘的計算機運算時間,以3秒的時間分辨率自動檢測睡眠階段,和87%的人類專家達成了一致的結論。此外,這種方式只需要在頭部的單個位置做記錄,用不到那些觸點和接線,也節省了大量佩戴和摘除的時間。2007年,我們創立了一家公司Neurovigil,想將這項技術引入睡眠診所,但診所對此沒有表現出多大興趣,因為靠人力標注能產生更多的現金流。實際上,依據保險號向患者開具賬單,會讓診所沒有動機采用更廉價的程序。Neurovigil在大型制藥公司發現了另一個市場,這些公司在開展臨床試驗,需要測試他們的藥物對睡眠模式的影響。這項技術目前正在進入長期護理設施市場,幫助解決在老年人中更普遍的進行性睡眠問題。

睡眠診所模式是存在缺陷的,因為在這樣的限制條件下不能可靠地診斷出健康問題:每個人的生理基數都不同,而偏離這個基數的信息最重要。Neurovigil已經有了一個小型設備iBrain,它可以在家里記錄你的腦電圖信息,將數據傳到網上并分析數據的長期趨勢和異常情況。這可以幫助醫生及早發現健康問題,在惡化前及時干預并阻止慢性疾病的發展。其他很多疾病的治療也將受益于持續監測,如1型糖尿病,血糖水平可以被監測并通過胰島素進行調節。使用能夠連續記錄數據的廉價傳感器正在對其他慢性疾病的診斷和治療產生重大影響。

從Neurovigil的發展過程中可以看出:第一,即便擁有更好更廉價的技術,也不代表能輕易地將其轉化為有市場價值,甚至更優質的新產品或服務;第二,當現有產品在市場中的地位根深蒂固,就會進一步開發出深入應用的二級市場,可以讓新技術產生更直接的影響,并爭取時間來改進,提升競爭力。太陽能和許多其他新興產業的技術就是這樣進入市場的。從長遠來看,已被證實具有優勢的睡眠監測和新技術將會覆蓋到家中的患者,并最終融入醫療實踐。

金融科技:利用數據和算法獲取最佳回報

紐約證券交易所超過75%的交易都是自動完成的(圖1–6),高頻交易能在幾分之一秒內進出倉位。(如果你不用為每筆交易支付費用,那么即使是很小的優勢也能帶來巨額利潤。)更長時間范圍內的算法交易會考慮到基于大數據的長期趨勢。深度學習在賺錢和提高利潤方面做得越來越好。參閱Ian Allison, “Former Nuclear Physicist Henri Waelbroeck Explains How Machine Learning Mitigates High Frequency Trading,” International Business Times, March 23, 2016, http://www.ibtimes.co.uk/former-nuclear-physicist-henriwaelbroeck-explains-how-machine-learning-mitigates-high-frequency-1551097/;Bailey McCann, “The Artificial-Intelligent Investor: AI Funds Beckon,” Wall Street Journal, November 5, 2017, https://www.wsj.com/articles/the-artificialintelligent-investor-ai-funds-beckon-1509937622/.預測金融市場,問題在于數據嘈雜,條件不穩定—— 一場選舉或國際沖突可能會導致投資者心態在一夜之間發生變化。這意味著用來預測今天股票價值的算法可能到明天就不準了。在實踐中,被用來賺錢的算法有數百種,表現突出的則被不斷整合以實現最優回報。

圖1-6 延遲vs頭寸持有時間。在線機器學習正在推動算法交易,它比傳統的長期投資策略更快速,比股票市場中的高頻交易更加慎重。許多不同類型的機器學習算法被組合運用以獲得最佳回報。

早在20世紀80年代,我還在為摩根士丹利的股票交易神經網絡模型提供咨詢時,遇到了專門設計并行計算機的計算機科學家大衛·肖(David Shaw)。哥倫比亞大學學術休假期間,肖曾在自動化交易早期擔任量化分析師,隨后他在華爾街創立了自己的投資管理公司德劭集團(The D. E. Shaw Group),現在他已經是億萬富翁了。德劭集團非常成功,但仍然遜于另一家對沖基金文藝復興科技公司(Renaissance Technologies)。這家基金是由杰出的數學家、紐約州立大學石溪分校數學系前主任詹姆斯·西蒙斯(James Simons)創立的。僅2016年,西蒙斯就掙了16億美元,這還算不上他最好的一年。Sei Chong, “Morning Agenda: Big Pay for Hedge Fund Chiefs despite a Rough Year,” New York Times, May 16, 2017, https://www.nytimes.com/2017/05/16/business/dealbook/hedge-funds-amazon-bezos.html.文藝復興科技被稱為“世界上最好的物理和數學系,”除了雇用了數千名數學家的美國國家安全局。Alfred W. Hales, personal communication, May 4, 2016.“它不會雇用帶有哪怕一點點華爾街正統味道的人”。Sarfaz Manzoor, “Quants: The Maths Geniuses Running Wall Street,” Telegraph,July 23, 2013, http://www.telegraph.co.uk/finance/10188335/Quants-the-mathsgeniuses-running-Wall-Street.html.

不再參與德劭的日常運營后,大衛·肖現在專注于德劭研究所(D. E. Shaw Research)的業務,該研究所搭建了一臺名為“Anton”的專用并行計算機,比全球其他計算機執行蛋白質折疊的速度都快得多。D. E. Shaw, J. C. Chao, M. P. Eastwood, J. Gagliardo, J. P. Grossman, C. Ho, et al., “Anton: A Special-Purpose Machine for Molecular Dynamics Simulation,”Communications of the ACM51, no. 7 (2008): 91–97.西蒙斯退休后不再掌管文藝復興科技,而是建立了資助自閉癥及其他物理和生物科學項目研究的基金會。通過加州大學伯克利分校的西蒙斯計算理論研究所(the Simons Institute for the Theory of Computing at UC Berkeley)、麻省理工學院的西蒙斯社會大腦中心(the Simons Center for the Social Brain at MIT)和紐約熨斗研究院(the Flatiron Institute),西蒙斯的慈善事業對推進數據分析、建模和仿真的計算方法產生了重大影響。D. T. Max, Jim Simons, “The Numbers King,” New Yorker, December 18 &25, 2017, https://www.newyorker.com/magazine/2017/12/18/jim-simons-thenumbers-king/.

更廣泛的金融服務正在金融科技(fintech)的大背景下發生大規模轉型。諸如區塊鏈這樣的信息技術—— 一種安全的互聯網記賬方式,取代了金融交易的中間商——正在接受小規模的測試,但它很快就會擾亂價值數萬億美元的金融市場。機器學習正在被用于改進貸款信用評估,準確地提供業務和財務信息,在社交媒體上獲取預測市場趨勢的信號,并為金融交易提供生物識別安全服務。誰擁有最多的數據,誰就是贏家,而世界上充斥著財務數據。

深度法律:效率的提高與費用的降低

深度學習剛剛開始影響法律界。律師事務所每小時收費數百美元的法務助理的大部分日常工作都將實現自動化,特別是在高檔寫字樓辦公的規?;聞账铩>唧w點說,技術輔助審核或調查將被人工智能接管,它可以瀏覽數千份文件以獲取合法證據,且絲毫不會感到厭倦。自動化深度學習系統也將幫助律師事務所遵守日益復雜的政府規定。這些系統將為現在無法負擔律師費用的普通人提供法律建議。法律工作不僅收費會更便宜,也會更高效,這一點通常比費用更重要。法律世界正在走向“深度法律”。很快就會被拍成電影。

德州撲克:當機器智能學會了虛張聲勢

一對一無限注德州撲克是最受歡迎的撲克玩法之一,常見于賭場,無限注投注方式則通常出現在世界撲克系列賽(World Series of Poker)的主賽事中。撲克很有挑戰性,因為與國際象棋玩家可以獲得相同的信息不同,撲克玩家的信息不完整,而且在最高級別的比賽中,詐唬、欺騙的技巧和拿到的牌一樣重要。

數學家約翰·馮·諾依曼(John von Neumann)創立了數學博弈理論,也是數字計算機之父,他就對撲克特別著迷。他說過:“現實生活包括虛張聲勢,一點欺騙手段,以及自問另一個人會怎么評判我做事的意圖。這就是我理論中博弈的內涵?!?img alt="約翰·馮·諾依曼,引自根據雅各布·布羅諾夫斯基(Jacob Bronowski)的著作改編的電視紀錄片《人類的攀升》 (The Ascent of Man),第13集(1973年)。" class="qqreader-footnote" src="https://epubservercos.yuewen.com/EBD243/13173573105664606/epubprivate/OEBPS/Images/note.png?sign=1752582634-WHoYn25ATqf22x9YEt7bXmxGDJSk3BbY-0-2d3cf5cce6484bb40bacf1d902734607">撲克是一種博弈,反映了經過進化精煉過的人類智能的一部分。一個名為“DeepStack”的深度學習網絡和33名職業撲克選手進行了44852場比賽。令撲克專家震驚的是,它以相當大的優勢,一個標準差,擊敗了最出色的撲克玩家,同時以四個標準差在整體上擊敗了全部33名玩家——多么巨大的差距(見圖1–7)。參閱M. Moravík, M. Schmid, N. Burch, V. Lisy, D. Morrill, N. Bard, et al.,“Deep-Stack: Expert-Level Artificial Intelligence in Heads-Up No-Limit Poker,”Science356, no. 6337 (2017): 508–513。標準偏差是鐘形曲線的半峰寬。只有16% 的樣本落入平均值的一個標準偏差之外的區域。只有萬分之三的樣本在平均值的四個標準偏差以外。如果這一成就能復制到其他基于不完全信息、需要人來做判斷的重要領域,比如政治學和國際關系,其影響可能是極其深遠的。腦海中浮現出了1983年科幻電影《戰爭游戲》(War Games)中的場景。參閱https://en.wikipedia.org/wiki/WarGames。

圖1-7 一對一無限注德州撲克。強勢手牌。DeepStack已經掌握了如何在高籌碼撲克中虛張聲勢,以大比分優勢擊敗職業撲克玩家。

AlphaGo奇跡:神經科學與人工智能的協同

2016年3月,韓國圍棋界18次世界冠軍獲得者李世石(Lee Sedol)與DeepMind公司的AlphaGo(圖1–8)——一個使用深度學習網絡評估盤面形勢和可能的走法的圍棋程序——進行了5場比賽。參閱D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G. v. d. Driessche,et al., “Mastering the Game of Go with Deep Neural Networks and Tree Search,”Nature529, no. 7587 (2016): 484–489.圍棋相對國際象棋的難度,相當于國際象棋對跳棋的難度。如果國際象棋是一場戰役,那么圍棋就是一場戰爭。一塊19×19圍棋棋盤比一塊8×8象棋棋盤大得多,這使得在棋盤的不同部分可能同時發生多場戰役。不同戰役之間存在長期的相互作用,即使是專家也難以判斷。圍棋的合法棋局總數是10170,遠遠超過宇宙中的原子數量。

圖1-8 韓國圍棋冠軍李世石對戰AlphaGo的5場比賽里,某一場戰局中的棋盤。AlphaGo是一個通過與自己下圍棋來學習的深度學習神經網絡。

除了幾個評估盤局并選擇最佳著數的深度學習網絡,AlphaGo還有一個完全不同的學習系統,用于解決時間信用分配問題:在眾多步棋中,哪一步對贏得勝利有所貢獻,哪一步對失敗承擔責任?大腦的基底神經節接收來自整個大腦皮層的投射,并投射回去,利用時間差分算法和強化學習來解決這個問題。AlphaGo使用由基底神經節進化出來的相同的學習算法,以評估最大化未來獎勵的行動順序(這一過程將在第10章中做出解釋)。AlphaGo通過反復和自己下棋來學習這一技能。

AlphaGo和李世石對決的圍棋比賽在亞洲得到了極高的關注。在亞洲,圍棋冠軍是全國性的公眾人物,有著搖滾明星一樣的待遇。AlphaGo早些時候擊敗了歐洲的圍棋冠軍,但是那場比賽的水平遠低于亞洲的最高水平,因此李世石并沒有做好打一場硬仗的心理準備。即使是開發AlphaGo的公司DeepMind,也并不清楚他們的深度學習程序到底有多強大。自上一場比賽以來,AlphaGo已經與好幾個版本的自己下了數百萬局的棋,然而并沒有任何標準來判斷它的水平到底達到了何種高度。

AlphaGo贏得了5場比賽的前3場后,許多人都感到十分震驚,因為它展現出了讓人意想不到的高水準。這項比賽在韓國有很高的關注度,所有的主流電視臺都對比賽進行了實況報道。AlphaGo有一些著數是革命性的。在第二場比賽的第三十八步,AlphaGo下出了精彩的一著,讓李世石感到十分驚訝,他花了將近10分鐘的時間才決定下一步要怎么走。AlphaGo輸掉了第四場比賽,這是人類挽回顏面的一場勝利,最終它的戰績是4勝1負(圖1–9)。“我不知道今天該說些什么,”李世石告訴媒體記者,“但我想我必須先表示歉意。我應該能表現得更好,在比賽中占據更多的主動。我也很抱歉,讓很多人失望了。我覺得很無助。如果回顧三場比賽,即使第一場比賽能夠重賽,我也不認為自己會取勝,因為那時我誤判了AlphaGo的能力?!?Jordan Novet, “Go Board Game Champion Lee Sedol Apologizes for Losing to Google’s AI,” Venture Beat, March, 12, 2016, https://venturebeat.com/2016/03/12/goboard-game-champion-lee-sedol-apologizes-for-losing-to-googles-ai/。3月的夜晚,我在圣迭戈的凌晨興致勃勃地觀看了這場較量。這讓我回想起1966年6月2日凌晨1點,我在克利夫蘭市,坐在電視機旁關注著“勘測者1號”探測器降落在月球上,并傳回了第一張月球照片。“勘測者1號”于1966年6月2日,國際標準時間6點17分36秒(美國東部時間凌晨1點17分36秒)登陸月球表面。著陸點位于弗拉姆斯蒂德火山口(Flamsteed Crater)以北一個直徑為100公里的隕坑內。我親眼見證了這些歷史時刻。AlphaGo的表現遠遠超出了我和其他許多人的期待。

圖1-9 在2016年3月的圍棋挑戰賽中輸給了AlphaGo之后的李世石。

2017年1月4日,一個名為“Master”的選手在一個網絡圍棋服務器上主動現身,其真正身份是AlphaGo 2.0。在此之前,它在與世界頂尖棋手的比賽中取得了60場全勝的戰績,被擊敗的棋手中包括當時世界排名第一的高手,19歲天才棋手柯潔。AlphaGo顯露出了一種能與同時代的佼佼者抗衡的全新風格。2017年5月27日,在中國烏鎮舉辦的圍棋峰會上,柯潔以3場皆負的結果輸給了AlphaGo(見圖1–10)。這是有史以來最精彩的幾場圍棋比賽,數億中國人都觀看了該賽事?!叭ツ?,我還覺得AlphaGo的表現與人類非常接近,但今天我認為它是‘圍棋之神’?!笨聺嵾@樣總結道。Ke Jie, as quoted in Selina Cheng, “The Awful Frustration of a Teenage Go Champion Playing Google’s AlphaGo,” Quartz, May 27, 2017, https://qz.com/993147/the-awful-frustration-of-a-teenage-go-champion-playing-googlesalphago/.

在第一場比賽中,他以一目半的微弱差距輸掉了比賽??聺嵳f他“在比賽中途已經感覺快要贏了”。他非常興奮:“我能感覺到自己的心臟在怦怦直跳!可能因為我太興奮,有幾步棋走錯了。也許這就是人類棋手最薄弱的部分吧?!?img alt="Ke Jie, as quoted in Paul Mozur, “Google’s A.I. Program Rattles Chinese Go Master As It Wins Match,” New York Times, May 25, 2017, https://www.nytimes.com/2017/05/25/business/google-alphago-defeats-go-ke-jie-again.html." class="qqreader-footnote" src="https://epubservercos.yuewen.com/EBD243/13173573105664606/epubprivate/OEBPS/Images/note.png?sign=1752582634-WHoYn25ATqf22x9YEt7bXmxGDJSk3BbY-0-2d3cf5cce6484bb40bacf1d902734607">柯潔經歷了一種情緒上的超負荷,但要達到最佳狀態,更需要相對沉穩的情緒。事實上,舞臺演員們都知道,如果他們演出前沒有胃里翻江倒海的緊張感,就無法呈現出最精彩的演出。他們的表演遵循一種倒U形曲線,即最佳狀態處于較低和較高的興奮點之間。運動員把這叫作“在狀態”。

圖1-10 2017年在中國,DeepMind的聯合創始人兼CEO德米斯·哈薩比斯(Demis Hassabis,左)和柯潔在歷史性的圍棋比賽結束后會面,共同展示帶有柯潔簽名的棋盤。圖片來源:德米斯·哈薩比斯。

2017年5月26日,AlphaGo還擊敗了由5名頂尖棋手組成的隊伍。這些棋手都分析過AlphaGo的招數,并已經在相應地改變自己的策略。這場比賽由中國政府主辦,可以說是一個新版的“乒乓外交”。老版的“乒乓外交”指1971年中國和美國乒乓球隊開展互訪的友好往事,不僅推動了中美兩國關系正常化的進程,也加速了中國走向世界的步伐?!幷咦? class=中國正在機器學習方面投入大量資金,其大腦研究計劃的一個主要目標是挖掘大腦潛能來創造新的算法。Paul Mozur, “Beijing Wants A.I. to Be Made in China by 2030,” New York Times,July 20, 2017, https://www.nytimes.com/2017/07/20/business/china-artificialintelligence.html.

該圍棋事件后續的發展可能會更令人驚嘆。在開始跟自己下棋之前,AlphaGo是通過觀察學習16萬次人類圍棋比賽起步的。有人認為這是作弊——一個自主的AI程序應該能夠在沒有積累任何人類知識的條件下學習下圍棋。2017年10月,一款名為AlphaGo Zero的新版本AI程序面世了。它從游戲規則開始一步步學習下圍棋,擊敗了曾戰勝柯潔的版本AlphaGo Master,戰績為100∶0。Silver D., J. Schrittwieser, K. Simonyan, I. Antonoglou, A. Huang, A. Guez, T.Hubert, L. Baker, M. Lai, A. Bolton, Y. Chen, T. Lillicrap, F. Hui, L. Sifre, G. van den Driessche, T. Graepel, and D. Hassabis, “Mastering the Game of Go Without Human Knowledge,” Nature550 (2017): 354–359.此外,AlphaGo Zero的學習速度比AlphaGo Master快100倍,而計算能力差不多只有后者的1/10。完全忽略人類的知識,AlphaGo Zero變成了無敵超人。隨著機器學習算法的不斷進步,AlphaGo還會變得多么優秀,并沒有已知的上限。

AlphaGo Zero雖然沒有和人下棋,但仍然有許多圍棋知識被人為添加到程序中強化棋藝的特征。如果沒有任何圍棋知識,AlphaGo Zero也許仍有進一步改進的空間。就像零度可樂將可口可樂里所有的熱量分離出來一樣,圍棋的所有知識都被從Alpha Zero中剝離出來。結果,Alpha Zero能夠更快、更果斷地打敗AlphaGo Zero。David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis, Mastering Chess and Shogiby Self-Play with a General Reinforcement Learning Algorithm, arXiv:1712.01815(2017).為了進一步說明“少就是多”,Alpha Zero在沒有改變任何一個學習參數的情況下,學會了如何以超人的水準下國際象棋,還創造了人類從未使用過的著數。在與Stockfish這個已經是超人級別的頂級國際象棋程序的對決中,Alpha Zero還沒有輸過。在一場比賽中,Alpha Zero大膽地犧牲了一個象——這種做法通常用來獲得位置上的優勢,隨后又犧牲了王后,這一步看起來像是個大昏著兒,直到很多步以后,Alpha Zero冷不防將了一軍,無論是Stockfish還是人類棋手都沒能預見到這樣的結果。外星人已經著陸,地球從此要改頭換面了。

AlphaGo的開發者DeepMind于2010年由神經學家德米斯·哈薩比斯參與創立,他曾在倫敦大學學院的蓋茨比計算神經科學部門(University College London’s Gatsby Computational Neuroscience Unit)擔任博士后研究員。該部門由彼得·達揚(Peter Dayan)領導,達揚曾是我實驗室的博士后研究員,2017年和雷蒙德·多蘭(Raymond Dolan)以及沃爾夫拉姆·舒爾茨(Wolfram Schultz)共同獲得了享有盛譽的“大腦獎”(Brain Prize),以表彰他們在獎勵學習方面的研究。谷歌在2014年以6億美元的價格收購了DeepMind。該公司雇用了400多名工程師和神經科學家,擁有學術界和創業公司混合的雙重文化。神經科學與人工智能之間的協同作用日漸深入,而且還在加速。

弗林效應:深度學習讓人類更加智能

AlphaGo有智力嗎?除了“意識”這個主題,關于智力的文章比心理學中任何其他主題都要多得多,這兩個概念都很難界定。自20世紀30年代以來,心理學家就對流體智力和晶體智力進行了區分——流體智力能夠將新條件中的推理和模式識別用于解決新問題,而不依賴于以前的知識;晶體智力則依賴于先前的知識,也是標準智商測試(即IQ測試)的對象。流體智力遵循一種拋物線式發展軌跡,在成年早期達到高峰,并隨著年齡的增長逐漸下降;而晶體智力會隨年齡的增長,緩慢漸進式地提高,直至暮年。AlphaGo只在一個相當狹窄的領域同時展現出了晶體智力和流體智力,但在這個領域,它表現出了令人驚訝的創造力。專業知識的獲取也是基于在狹窄領域的學習。我們都是語言領域的專家,每天都在使用語言。

AlphaGo使用的強化學習算法可以被用來解決許多問題。這種形式的學習只取決于在一系列動作結束時給予獲勝者的獎勵,這似乎和提前做出更好的決策相矛盾。結合了許多強大的深度學習網絡,就會生成許多領域相關的智能。而且事實上,已經出現了與領域相關的不同類型智能,例如社會、情感、機械和建筑等的案例。Harold Gardner, Frames of Mind: The Theory of Multiple Intelligences, 3rd ed. (New York: Basic Books, 2011).智力測試測量的一般因素(general factor,簡稱g因素)與這些不同類型相關。我們有理由認真審視IQ測試。自20世紀30年代首次測試智力以來,全人類平均的IQ分數每10年會上升三個點,這一趨勢被稱為“弗林效應”(Flynn effect)。對于弗林效應有許多可能的解釋,比如更充足的營養、更完善的醫療體系,以及其他環境因素。J. R. Flynn, “Massive IQ Gains in 14 Nations: What IQ Tests Really Measure,”Psychological Bulletin101, no. 2 (1987):171–191.這很有道理,因為環境會影響基因調控,從而影響大腦內在的連接,行為也會隨之發生變化。S. Quartz and T. J. Sejnowski, Liars, Lovers and Heroes: What the New Brain Science Has Revealed About How We Become Who We Are(New York: Harper Collins, 2002).隨著人類越來越多地生活在人造環境中,大腦正在以某種超越自然進化軌道的方式被塑造。在更長的時間內,人類是否能一直都在變得更聰明?智商增長會持續多久?用電腦玩國際象棋、西洋雙陸棋和圍棋的人數自計算機程序達到冠軍級別后一直在穩步增加,而機器也強化了人類玩家的智能。Douglas C. Engelbart, Augmented Intelligence: Smart Systems and the Future of Work and Learning, SRI Summary Report AFOSR-3223 (Washington, DC:Doug Engelbart Institute, October 1962), http://www.dougengelbart.org/pubs/augment-3906.html.深度學習提升的將不僅僅是科學研究人員的智能,還包括所有行業從業人員的智能。

科學儀器正以驚人的速度產生數據。位于日內瓦的大型強子對撞機(LHC)中發生的基本粒子碰撞每年產生25PB(1PB=1000TB)的數據。大型綜合巡天望遠鏡(LSST)每年將產生6PB的數據。機器學習正被用于分析龐大的物理和天文數據集,其規模之浩大讓人類根本無法通過傳統方法進行搜索。M. Young, “Machine Learning Astronomy,” Sky and Telescope, December (2017):20–27.例如,DeepLensing是一種神經網絡,可以識別遙遠星系的圖像。這些圖像由于光在傳播中因圍繞周邊星系的“引力透鏡”造成的光路偏折而被扭曲了。這一技術可以自動發現許多遙遠的新星系。物理學和天文學中還有許多其他類似“大海撈針”的問題,而深度學習能夠讓傳統的數據分析方法如虎添翼。

新教育體系:每個人都需要終身學習

銀行在20世紀60年代后期推出了面向銀行賬戶持有人的全天候現金提取服務,這對于那些在銀行正常營業時間之外需要現金的人來說非常方便,自動提款機(ATM)從此獲得了閱讀手寫支票的能力。盡管它們的存在減少了銀行柜員的日常工作量,但有越來越多的柜員為客戶提供按揭和投資建議等個性化服務,同時也出現了維修ATM的新工種。“Are ATMs Stealing Jobs?” The Economist, June 15, 2011, https://www.economist.com/blogs/democracyinamerica/2011/06/technology-and-unemployment/.就如一方面,蒸汽機代替了體力勞動者,但另一方面,這為能夠建造和維護蒸汽機及驅動蒸汽機車的熟練工人提供了新的就業機會。亞馬遜的在線營銷也將許多員工從當地實體零售店中遷移出來,但同時也為分配和運輸其商品,以及許多使用其平臺的企業創造了38萬個新的工作機會。John Taggart and Kevin Granville, “From ‘Zombie Malls’ to Bonobos: What America’s Retail Transformation Looks Like,” New York Times, April 15, 2017.由于現在需要人類認知技能的工作被自動化人工智能系統所接管,那些能夠創建和維護這些系統的人將會獲得新的工作。

工作變動不是什么新鮮事。19世紀,農場勞工被機器取代,機器也在城市工廠創造了新的工作機會,所有這些都需要一個教育系統來培訓工人新的技能。不同之處在于,今天,由人工智能開辟的新職位除了需要傳統的認知技能之外,還需要新的、不同的、不斷變化的技能。E. Brynjolfsson and T. Mitchell, “What Can Machine Learning Do? Workforce Implications,” Science(2017): 358:1530–1534. doi: 10.1126/science.aap8062.所以我們都需要終身學習。要做到這一點,我們需要一個以家庭,而不是以學校為基礎的新教育體系。

幸運的是,就像尋找新工作的需求變得迫在眉睫一樣,互聯網上免費的大規模開放式在線課程慕課(MOOCs)也應運而生,來幫助人們獲取新的知識和技能。雖然仍處于初級階段,但慕課的在線教育生態系統正在迅速發展,并在為更廣泛的人群提供前所未有的優質教學。與下一代數字輔助系統相結合,慕課則可能會帶來變革。芭芭拉·奧克利(Barbara Oakley)和我開設了一門名為“學會如何學習”(Learning How to Learn)的慕課——該熱門課程會教你如何成為更好的學習者(見圖1–11)——以及一門名為“思維轉換”(Mindshift)的慕課,教你如何改造自己并改變你的生活方式(這兩門課將在第12章中詳細介紹)。

圖1-11 “學會如何學習”教你如何成為更好的學習者,它是互聯網上最受歡迎的慕課,擁有超過300萬學習者。

進行網上操作時,其實正在生成機器可讀的關于你自己的大數據。根據你在互聯網上行為的蛛絲馬跡,你正在被自動生成的相關廣告定位。你在Facebook(臉譜網)和其他社交媒體網站上發布的信息可被用于創建數字助理,它幾乎比世界上任何其他人都更了解你,并且不會遺漏任何內容,實際上就相當于你的虛擬分身。通過將互聯網跟蹤和深度學習都納入服務,現在這些孩子的后代擁有的教育機會將比今天富裕家庭擁有的最優質的教育機會還要好。這些孫輩將擁有自己的數字導師,導師將在整個教育過程中陪伴他們。教育不僅會變得更加個性化,也會變得更加精準。世界各地已經開展了各種各樣的教育實驗,例如可汗學院,由蓋茨基金會、陳–扎克伯格基金會和其他慈善基金會資助。這些實驗機構正在測試軟件,以便讓所有的孩子都可以根據自己的節奏進步,并適應每個兒童的特定需求。“Technology Is Transforming What Happens When a Child Goes to School:Reformers Are Using New Software to ‘Personalise’ Learning,” Economist, July 22, 2017, https://www.economist.com/news/briefing/21725285-reformers-areusing-new-software-personalise-learning-technology-transforming-what-happens/.數字導師的普及將使教師從教學中的重復勞動,如評分中解脫出來,專注于人類最擅長的事情——對學習困難的學生提供精神支持,并給予有天賦的學生靈感啟發。教育技術(Edtech)正在快速發展,與自動駕駛汽車相比,傳統教育向精準教育過渡的速度可能相當快,因為它必須克服的障礙要小得多,需求卻要大得多,而且美國的教育是一個萬億美元的市場。教育市場的估值超過1.2萬億美元,主要包含三個領域:早期兒童教育(700億美元),K–12(即從幼兒園到高中三年級的基礎教育,6 700億美元),以及高等教育(4 750億美元)。參閱Arpin Gajjar, “How Big Is the Education Market in the US: Report from the White House,” Students for the Future, October 10, 2008, https://medium.com/students-for-the-future/how-big-is-the-educationmarket-in-the-us-report-from-white-house-91dc313257c5。一個主要的問題就是,誰能夠訪問數字助理和數字導師的內部文件。

正面影響:新興技術不是生存威脅

AlphaGo在2016年毫無爭議地擊敗了李世石,這激化了過去若干年引發的人工智能可能給人類帶來威脅的擔憂。計算機科學家簽署了不會將AI用于軍事目的的承諾協議。斯蒂芬·霍金(Stephen Hawking)和比爾·蓋茨(Bill Gates)公開發表聲明,警告人工智能可能對人類造成的生存威脅。伊隆·馬斯克(Elon Musk)和其他硅谷企業家成立了一家新公司OpenAI,擁有10億美元儲備金,并聘請了杰弗里·辛頓之前的一名學生伊利婭·蘇特斯科娃(Ilya Sutskever)擔任第一任總監。雖然OpenAI的既定目標是確保未來人工智能的發現將公開供所有人使用,但它還有另一個隱含的更重要的目標:防止私人公司作惡。AlphaGo戰勝了圍棋世界冠軍李世石,一個臨界點也隨之到來。幾乎在一夜之間,人工智能從一項失敗的技術,轉變成了可感知的生存威脅。

一種新興技術被看作生存威脅,這已經不是第一次了。核武器的發明、改進和儲存曾經是一種毀滅全世界的威脅,但至少到目前為止,我們有能力阻止這種情況的發生。重組DNA技術剛問世的時候,人們擔心經人工改造的致命生物會從實驗室逃出來,導致全球范圍內出現難以估量的痛苦和死亡?;蚬こ态F在已經是一項成熟的技術,目前我們已經能和它的產物共存。與核武器和致命生物相比,機器學習的最新進展構成的威脅相對較小。我們也將適應人工智能。事實上,這已經在發生了。

DeepStack的成功帶來的其中一個暗示是,深度學習網絡可以學習如何成為世界頂級的騙子。訓練深層網絡能干什么只受限于訓練者的想象力和數據。如果一個網絡可以接受安全駕駛汽車的訓練,那么它也可以被訓練駕駛F 1賽車,很可能有人愿意為此掏腰包。今天,我們仍然需要技術嫻熟和訓練有素的從業人員使用深度學習來搭建產品和服務,但隨著計算能力的成本持續下降、軟件功能更加自動化,很快,高中生就可能具備開發AI應用程序的能力了。作為德國收入最高的在線電子商務公司,奧托(Otto)主要經營服裝、家居和體育用品。它正在利用深度學習,根據歷史訂單信息預測客戶未來可能購買的產品,并提前為他們下單。“Algorithmic Retailing: Automatic for the People,” Economist, April 15, 2017,客戶幾乎在訂購前就收到了自己想訂購的商品,準確率達到90%。自動完成工作且無須人工干預,這種預訂操作不僅可以每年為公司在剩余庫存和退貨環節節省數百萬歐元,還提高了客戶滿意度和保有率。深度學習顯著提高了奧托公司的生產力,卻并沒有取代它的工人。人工智能可以讓你在工作中更高效。

雖然主要的高科技公司開拓了深度學習的應用,但機器學習工具已經普遍存在了,許多其他公司也開始從中受益。Alexa是一個廣受歡迎的數字助理,與亞馬遜Echo智能音箱配合使用,能夠基于深度學習對自然語言發出的請求做出回應。亞馬遜網絡服務(AWS)引入了名為“Lex”、“Poly”和“Comprehend”的工具箱,可以分別基于自動化文字、語音轉換、語音識別和自然語言理解,方便地開發相同的自然語言界面。具有對話交互能力的應用程序現在可供無力雇用機器學習專家的小型企業使用。企業通過應用這一程序可以提高客戶滿意度。

當最好的人類棋手在計算機程序面前都黯然失色時,人類會不再下棋嗎?正相反,人工智能會提高人類的競技水平,也使得棋類競技更加大眾化。頂級的國際象棋選手曾經都來自莫斯科和紐約等大城市。這些地方大師云集,可以教授年輕棋手并提高他們的技能水平。國際象棋電腦程序使得在挪威小鎮長大的馬格努斯·卡爾森(Magnus Carlson)13歲就成為國際象棋大師,如今他已是世界國際象棋冠軍。人工智能不僅對游戲產生了正面的影響,更會推動人類付諸努力的各個方面,從藝術到科學。AI可以讓你變得更聰明。T. J. Sejnowski, “AI Will Make You Smarter,” in Brockman, J. (ed.), What to ThinkAbout Machines That Think(New York: Harper Perennial, 2015), 118–120.

回到未來:當人類智能遇到人工智能

本書有兩個相互交織的主題:人類智能是如何進化的,以及人工智能會如何演變。這兩種智能之間的巨大差異在于,人類智能的進化經歷了數百萬年的時間,而人工智能在最近幾十年才發展起來。盡管對于文化演變來說,這個速度仍然是快得出奇,但是過于謹小慎微可能并不是個正確的選擇。

深度學習在近期取得的突破,并不是你從新聞報道中讀到的那種一夜成功。從基于符號、邏輯和規則的人工智能向基于大數據和學習算法的深度學習網絡的轉變,其背后的故事通常并不為人所熟知。本書介紹了這個故事,并從我的角度探討了深度學習的起源和成果。作為20世紀80年代開發神經網絡學習算法的先行者和NIPS基金會的主席,我親身經歷了過去30年機器學習和深度學習的發展過程。我和同在神經網絡領域的同事多年來都未能取得令人矚目的成就,但堅持和耐心最終給我們帶來了回報。

主站蜘蛛池模板: 平原县| 砀山县| 漠河县| 和平县| 潞西市| 巴林左旗| 大厂| 屏东市| 库尔勒市| 肥东县| 晋州市| 舞阳县| 镇巴县| 全州县| 治多县| 凤凰县| 花莲市| 龙口市| 崇左市| 裕民县| 平顶山市| 闽侯县| 亳州市| 吉安市| 福鼎市| 宁乡县| 宁阳县| 泸西县| 巩留县| 大渡口区| 小金县| 青州市| 抚顺县| 洞头县| 东乡族自治县| 梅河口市| 广饶县| 颍上县| 策勒县| 嵊州市| 天祝|