書名: ChatGPT時代:正在到來的人工智能新浪潮作者名: 熙代本章字數: 1544字更新時間: 2024-02-28 15:04:19
AI已涌現“不可預測的能力”
在18世紀晚期,奧地利有一位發明家名叫沃爾夫岡·馮·肯佩倫,他為了取悅特蕾西婭女大公,建造了一個自動下棋裝置,起名為“土耳其行棋傀儡”。這個行棋傀儡可以擊敗人類棋手。然而,這其實是一個騙局,肯佩倫只是讓一名人類棋手藏在里面操作機器。藏在里面的棋手都是高手,因此,傀儡贏了大部分棋局。深度學習技術,已經讓這一古老的夢想成真。
深度思維(DeepMind)團隊研發的AlphaGo機器學習模型,曾經戰勝了圍棋世界冠軍。2017年,當時的圍棋第一人柯潔和AlphaGo進行比賽。比分最終落在了0:3,柯潔哽咽認輸。然而,無論是圍棋大師還是AlphaGo的設計者,都無法理解它為什么這樣走棋。
2017年,深度思維團隊又發布了更為震撼的版本阿爾法元(AlphaZero)的預印版論文,當即就引發了業內轟動。
阿爾法元通過與自己對弈并根據經驗更新神經網絡。事實證明,阿爾法元從“零”開始對戰訓練,不需要人類棋譜,自己和自己下棋,自己琢磨棋藝。兩小時就擊敗最強將棋AI,4小時擊敗最強國際象棋AI。在圍棋上,阿爾法元經過30小時的鏖戰,又擊敗了李世石版AlphaGo。
阿爾法元是一種更為“通用化”的深度學習模型,它利用一套深層神經網絡與大量“通用型”算法取代了手工編寫的規則,利用深度神經網絡從零開始進行增強式學習。
阿爾法元的戰績和Halicin的發現,以及ChatGPT寫出的那些人模人樣的文章,都證明了人工智能在策略規劃、科研創新或內容生成方面所蘊藏的巨大潛力。
阿爾法元證明了人工智能至少在棋局里不受限于人類的知識。誠然它所用的人工智能是算法在深度神經網絡上訓練,這種機器學習有自己的限制??墒窃谠絹碓蕉嗟膽贸绦蚶?,機器正在設計出超越人類想象范圍的解決方案。
2016年,深度思維團隊將深度學習技術應用在智能數據中心,用以優化谷歌的數據中心冷卻系統,因為數據中心的溫度控制要很精密。盡管全世界最優秀的工程師已經解決了這個問題,但深度思維團隊研發的深度學習模型卻能精益求精,把能源支出又減少了40%,其表現大幅超越了人類。
人工智能應用在不同領域取得類似的突破,這個世界因此而改變,不只是讓機器以更有效率的方式執行人類的工作,在許多情況下,人工智能可以提出新的解決方案或方向,標志著另一種非人類的學習方式與邏輯評估方式的出現。
這些成就也預示了,隨著人工智能的發展,越來越多的人類無法理解的“隱性知識”將會涌現,相應地,一些隱性的風險也同樣會涌現。
在這些案例中,科學家開發出了一個機器學習模型,并給予機器一個目標,比如:贏得棋局,殺死細菌或根據提示回答文字,生成圖像、音樂、代碼等。在進行一段時間的訓練后,每一套程序都用不同于人類的方式掌握了各自的主題。這段訓練時間相對于人類的學習過程來說,是非常短促的。
有時,機器可以用人類永遠無法企及的算力獲得成果;有時,機器用人類觀摩后可以學習和理解的方式獲得了成果。然而,有時候,機器到底是怎么完成目標的,人類至今不得其解。也就是說,人類對機器是怎么思考的,“知其然不知其所以然”。
以辛頓為代表的人工智能研究者推測,通過擴展大語言模型(LLM )的參數規模,可以提升其解決任務的能力。谷歌公司的人工智能科學家,在評測各個LLM的表現時,曾經給出了200多個任務,其中一道題是這樣的:請根據以下表情符號(Emoji),猜一部電影的名字。

圖1-2 谷歌公司評測各個大型語言模型的測試題
一個最簡單的LLM的答案像是喝醉了的人給出的:《關于一個男人的故事》。
中等復雜度的LLM的答案相對靠譜一點,猜測是《Emoji大電影》,又譯為《表情奇幻冒險》。
而最復雜的模型則準確地猜中了答案:《海底總動員》。
這個看表情猜謎語的游戲,恐怕就是一般人類,也很少能給出正確答案。至于AI是如何涌現出這種能力的,卻難以解釋。谷歌公司的人工智能科學家伊?!ご鳡枺‥than Dyer)所做的一項調查表明,大語言模型可以創造出幾百種涌現能力,處理新的、不可預測的任務。