- AlphaGo六十連勝對局解析
- 江鑄久 芮乃偉
- 1718字
- 2019-09-12 14:50:08
第一篇 我們親歷的人機大戰
傳說、傳承、傳奇,AlphaGo改變人類的生活——從人工智能看圍棋史話
圍棋歷史悠久,但自發明起圍棋的規則就比其他棋類的規則簡單。圍棋起初是用來觀測天文、占卜的,后來逐漸演變成智力游戲。后來圍棋東渡至日本,并在日本得到迅速發展。在日本職業圍棋發展了300年后,14歲的吳清源老師遠渡日本,改寫了日本300多年的圍棋理論。吳清源老師在與當時的日本著名棋手本因坊秀哉對戰時,頻出奇招。在為時三個半月的比賽時間里,秀哉經常因為吳清源老師的一步棋就回去研究一個星期。直到深度學習的出現,我們才開始能理解吳清源老師的棋。因為在AlphaGo下圍棋時,經常就是采取這種方式,哪里都敢下,什么都敢想。在吳清源老師與本因坊秀哉對戰的最后收官階段,大廳里密密麻麻都是本因坊秀哉的弟子,都在思索對吳清源老師的應對方法。而這么多人,就好比今天的AlphaGo,使用了窮舉法。
從Deep Blue到Nature
20世紀90年代,很多計算機專家開始研究如何運用人工智能下圍棋,但在那個時候,人工智能技術遠落后于現在,根本無法下贏職業棋手。不過人工智能步伐堅定地在追趕。后來,人工智能系統Deep Blue擊敗了國際象棋冠軍卡斯巴羅夫,即使是這樣,人們仍然認為人工智能并不夠擊敗頂尖職業圍棋棋手,這是因為圍棋與國際象棋之間存在很大的差別。國際象棋利用窮舉法是可能窮盡的,即使窮盡不了,可能性也不會越來越多,只會是一條通途。但是利用窮舉法無法窮盡所有的圍棋招式,因為圍棋每一步后面都有著更多的可能性。退一步講,即使能夠窮盡,計算量也是一個難以想象的龐大數字,而這在當時是無法完成的。用當時美國專家的話來說便是:“用盡美國所有計算機,也無法完成。”
國際象棋冠軍卡斯巴羅夫輸給Deep Blue這一事件影響巨大。這些受影響的人當中有一位當時只有13歲的國際職業象棋棋手哈薩比斯。哈薩比斯深切地感受到人工智能的魅力,開始研究人工智能。正是他研發了現在叱咤風云的AlphaGo。
2015年深度學習團隊在《自然》雜志(Nature)上提出要向職業圍棋手挑戰。但是當時人工智能和頂尖職業圍棋棋手的差距是四五子,這是一個猶如天塹般的差距。然而在2016年,人工智能就迅速擊敗歐洲圍棋冠軍,登上《自然》雜志,震驚世界。存在2 000多年的圍棋就這樣被人工智能超越了。
縱觀這段歷史,人工智能從被普通圍棋職業棋手擊敗到擊敗國際象棋大師卡斯巴羅夫,再到擊敗歐洲圍棋冠軍,步伐緩慢卻堅定。
樹繁便剪枝
通過窮舉法很難突破圍棋,每一步后面都連接著無數個可能性,計算負擔巨大。這就類似搜索樹,枝丫非常繁雜。
但是深度學習提供了另外一種方式—“剪枝”。深度學習可以通過“剪枝”,即創造價值網絡來解決這一問題,兩法并用。首先是窮舉法,當時在將近3秒鐘的時間內,人工智能能夠走100萬步,這是一個非常了不起的進步。并且在使用窮盡法的同時,通過之前識別的棋譜來判斷每一步的價值,這樣就降低了巨大的搜索空間,能耗也隨之降低。在與李世石對戰時,AlphaGo連接了谷歌1 200多個中心。AlphaGo每一步成本是3 000美元的電費。而在烏鎮棋會上,AlphaGo計算所需要的能耗較與李世石的比賽已經下降了90%,因為此時的AlphaGo已經識別了非常多的著名棋譜。一位著名棋手,一般下棋不會超過2 000盤,而AlphaGo卻輸入了16萬張有名的棋譜,這使得AlphaGo對每一步價值的判斷更加準確,能耗便下降了。
從CPU(中央處理器)到GPU(圖形處理器),再到TPU(張量處理器),深度學習的東西越來越多,但是所需要的東西卻越來越少。人工智能能耗的下降使得人工智能應用的掣肘接近消失,應用范圍能夠更加廣泛。
變革與期望
一群業余棋手研發出AlphaGo,擊敗了世界頂尖棋手。這對世界的影響是巨大的,當時2.8億觀眾觀看了比賽,產生了3.5萬篇報告。大家都開始思索人工智能將會給我們的未來帶來什么樣的顛覆。
人工智能發展至今,已經完成了其當初的目標。烏鎮棋會時,柯潔在第三局比賽還未結束時落淚了。人工智能對于人類未來意味著變革。我們以前常提工業革命、工業資本家和資本顛覆了世界,以后將是智能革命、數據資本家和智能顛覆世界。從工業革命到智能革命,工業資本家到數據資本家,資本到智能,一切都是變革。人工智能的應用將極其廣泛,例如目前已經出現的智能投顧、人機對話、無人駕駛和太空探索等,而想象空間仍然巨大。總之,人工智能就像是一面鏡子,映出人更強的一面,促使人變得更強,不斷去挑戰極限,顛覆未來。