官术网_书友最值得收藏!

宏觀篇

第一章 邁向通用時代的人工智能

人工智能是模擬智能的系統,當前尤指計算機系統。人類模擬智能的想法由來已久,但直到電子技術取得進展,這一領域才得以真正發展。AI發展并非坦途,歷經幾輪興衰,通用性缺失一直是痛點。如今,以谷歌團隊提出的Transformer架構為代表的深度學習算法的成功,標志著AI邁入了通用模型時代,開始跨越不同智能場景模擬間的藩籬,歸納真實世界規律的能力取得了里程碑式的突破。在高性能算力和高質量數據的支撐下,AI還展現出規模定律特征,智能水平不斷提升。

本輪AI具備了應用普遍、催生創新、可改進的通用目的技術特征,并體現出廣泛的融合潛力。其應用潛力和商業前景已得到初步驗證,AI或已跨過S曲線的第一拐點,進入“研發—應用”循環迭代的加速期。在智能成本下降的推動下,產業與AI的融合浪潮已經襲來。而這一浪潮將在生產端提升生產效率的同時改變勞動結構,在消費端催生新智能產品需求的同時影響社會形態,進而對世界格局產生重要影響。

那么誰將引領這一場浪潮?在AI跨過S曲線第一拐點的背景下,哪個國家在“研發—應用”的循環迭代中勝出,哪個國家就有望成為本輪AI融合浪潮的引領者。AI在研發端的優勢取決于智能硬件的性能與規模、高質量數據獲取能力、優秀人才的儲備以及良好的創投環境,這往往帶來一定的先發優勢;而AI在應用融合端的優勢則更依賴多元的市場和鼓勵融合創新的政策環境。

為評估各國在本輪AI“研發—應用”的迭代強度,我們構建了研發層的“技術活躍度”以及應用層的“市場友好度”,兩者合并后得出可以反映“研發—應用”迭代能力的“AI發展指數”。總體而言,美國與中國的AI發展指數最高,美中是國際上引領本輪智能融合浪潮的前兩名國家。美國在技術活躍度上具有較大優勢,而中國在市場友好度上略勝一籌。德、日、英居于第二梯隊,與中美差距較大;印度由于市場友好度較高,緊隨第二梯隊之后。割裂的全球市場可能會阻礙AI的價值實現并抑制創新,這或許會促使部分國家在未來的智能融合浪潮中深化合作。[1]

一、AI進入通用模型時代

(一)人工智能是模擬智能的系統

人工智能(artificial intelligence,AI)指的是模擬智能的系統,在當今的語境中更多指的是計算機系統或與之相關的機器系統。人工智能是一個既古老又年輕的概念。言其古老,是因為“模擬智能”的思想源遠流長,在古希臘、古羅馬傳說中就出現過能完成特定任務或行為的類人智慧體。[2]談及年輕,則是因為“artificial intelligence”這一名詞直到1956年才在麥卡錫、明斯基和香農等人工智能先驅組織的達特茅斯會議上被正式提出。此后AI研究者發展出了多種基于邏輯規則、概率推理等的模擬智能的方法。其中,機器學習是人工智能的一個重要領域,它通過讓計算機系統從數據中學習和發現規律,[3]做出預測或決策,而不需要明確的編程指令。根據訓練過程中是否使用標記數據或進行反饋,機器學習可分為監督學習、無監督學習和強化學習。近年來,AI取得的許多關鍵成果,包括大語言模型,則來自機器學習的一個子領域——深度學習。深度學習使用多層神經網絡來模擬生物腦的功能,[4]從而使計算機系統能夠進行復雜的數據處理和模式識別等活動。當前,深度學習在圖像識別、語音識別、自然語言處理和自動駕駛等領域都取得了豐碩的成果。圖1.1是對前述人工智能不同方法間關系的一個簡單梳理。

圖1.1 人工智能方法劃分

資料來源:Prince S J D.“Understanding Deep Learning.”2023;中金研究院。

既然是模擬智能,那就不得不提及人類要模擬的智能究竟是什么。因為涉及多個學科和不同視角,直接給智能下定義是一件異常困難的工作,對其內核含義的探討甚至也遠超本章的內容范疇。如果只是簡單詮釋,那么智能就是一個多層次、復雜多維的概念,涵蓋了認知能力、學習能力、推理能力、問題解決能力以及其他與信息處理和理解相關的功能,這些功能是為了讓智能體在現實世界各種變化的場景中進行活動、實現目標。[5]上述的闡釋依然復雜,但我們如果從智能體“要做什么”去思考,就可以直觀地理解智能究竟是什么。唯物主義者相信真實的世界中存在著客觀的規律或者法則,并將其稱為真理,他們認為世界真理決定著世間萬物的運動方式以及相互間的聯系。[6]從這個角度講,智能體要做的工作就是根據萬事萬物的運動以及相聯系的信息,反推“世界真理”。智能體反推出來的規律和法則與世界真理越接近,那么它的智能水平就越高。比如,為什么我們會覺得牛頓和愛因斯坦的智能水平高,就是因為他們根據各類世界信息反推出的萬有引力、三大運動定律以及相對論,比其他人更加接近世界真理。

如果說智能體的工作是通過聯結萬事萬物的信息,從中尋找規律來反推世界真理,那么收集和處理信息的類型數量,就會決定其智能水平的高低。比如說某智能體在處理世界信息時存在限制,只能處理真實世界局部的信息,那么它就會像柏拉圖洞穴寓言[7]中被困于洞穴的人一樣,雖然他們看到的是真實世界在墻壁上的投影,但他們卻誤以為這些影子就是世界本身;他們可以總結出影子的運行規律,但這只是對世界真理的片面認知。當用這些規律來應對真實問題時,往往會出現偏誤。

為了更深入地理解這一點,我們可以設想一個智能體A,它只能處理某個特定領域的信息,例如天氣數據。雖然智能體A可以通過分析天氣數據,準確預測短期天氣變化,但如果在一個決策中遇到涉及其他領域的問題,如社會經濟發展、生態環境變化等,它就會因為處理信息的局限性而無法給出準確的判斷。相反,如果另一個智能體B能夠處理多種類型的信息,包括自然科學、人文社會、技術發展等各個方面的信息,它就更有可能從復雜的、跨領域的數據中發現更深層次的規律,推導出更接近世界真理的結論。這種多維度的信息處理能力,使得智能體B在面對復雜問題時,能夠綜合考慮多種因素,給出更加全面、準確的解決方案。

可以說,智能體的信息收集和處理能力的廣度與深度,直接決定了其智能水平的高低。僅能處理局部信息的智能體,就像柏拉圖洞穴寓言中的囚徒一樣,難以突破對世界真相的片面認知;而能夠整合多種信息的智能體,才有可能接近世界真理,做出更為準確的判斷和決策。理解這一點,對于我們理解今天人工智能的發展具有重要意義。

出于便利,人們有時也會為了區分不同場景下的應用需求,對人類所具有的智能進行分類。有人根據個體能力表現差異,把智能分為語言智能、邏輯數理智能、空間智能、運動智能、音樂智能、人際交往智能、內省智能和自然辨識智能;[8]也有人從方法論角度,把智能分為分析智能、創造智能、實踐智能三類;[9]還有人從認知心理學角度把智能分為理解能力、記憶能力、推理能力、計劃能力四類。[10]總的來說,人們對智能進行分類時有不同的邏輯依據,包括認知功能、應用領域、內容和形式、先天和后天因素、個體差異、任務環境需求等,呈現出百花齊放的狀態。不過從反推世界真理的角度來講,這些不同類型的智能對應著處理不同的信息類型,而人腦這一生物器官具備系統處理這些信息類型的能力。[11]

那么智能能否被模擬呢?在對智能來源的認知上,至少存在三種比較有代表性但又差異明顯的看法,不過從文獻發表的趨勢來看,現代學者越來越認同智能是一種可被模擬的客觀能力。第一種看法認為智能是超自然力的授予,是人類與超自然力相聯的標志,[12]這與古希臘神話中智慧體由神打造類似。[13]以阿奎那等神學家為代表,持這種看法的人認為人類無法也不應對智能進行模擬。第二種看法認為智能是人類特有的心理機制,依賴超脫物質世界的理念世界中的記憶,或者人類獨有的一些先天結構。以柏拉圖、笛卡兒、喬姆斯基等哲學家為代表,他們認為智能源于精神本質的心靈,[14]或者天賦決定的心智系統,[15]物質機制或許無法完整模擬人類智能。第三種看法認為智能來源于生物器官,比如大腦,而大腦產生智能的過程可以通過科學研究得到解釋和復制。神經科學的奠基人卡哈爾認為大腦的基本工作單元是神經元,[16]神經元通過突觸傳遞電信號和化學信號,突觸的可塑性(即突觸連接的變化)是學習和記憶的基礎。諾貝爾生理學或醫學獎得主坎德爾也認為智能可以通過神經科學的方法進行研究和解釋。[17]這三種看法各有支持者。不過,從每年發表的與“智能”相關的新增文獻所屬學科占比可以看出,現代的學者越來越傾向于將智能納入生物醫學、計算機科學等基于物質客觀規律的研究范疇中進行研究和討論(見圖1.2)。

圖1.2 智能相關研究學科分布變化

注:該圖統計時合并了部分學科,其中“社會科學”不包含經濟學、心理學;*表示統計時間截至2024年4月。

資料來源:OpenAlex,中金研究院。

(二)智能模擬曲折前行——通用性不足是短板

在人工智能發展的文獻中,我們經常可以看到類似圖1.3的記錄著AI發展重要事件的示意圖。這些事件雖然對于AI研究者來說已經耳熟能詳,但理解過去幾十年AI的發展路徑,對于認知當前AI里程碑式的突破具有重要意義。我們在前文討論過,一個智能體可以處理多少不同類型信息決定著該智能體的智能水平。過去較長一段時間,由于AI模型的泛化和通用性較差,其在處理不同類型信息方面一直存在著隱性的壁壘,具體表現為雖然其在特定領域可以體現出某種智能,但跨場景的智能移植能力卻很弱。

圖1.3 人工智能發展經歷起伏

注:圖中縱軸用投資&研究=f(期望,成果)來表示。

資料來源:Bognar M Z.“Prospects of AI in Architecture: Symbolism, Connectionism, Actionism.”2022;Francesconi E.“The Winter, the Summer and the Summer Dream of Artificial Intelligence in Law.”2022;中金研究院。

從20世紀開始,模擬人類智能這一目標驅動著AI研究者們前赴后繼、曲折前進,過程中有過熱潮也出現過寒冬,波折歷史背后暗含著一條模擬生物腦(聯結主義)—模擬邏輯(符號主義)—小場景模擬(行為主義)—聯結主義復興的演進主線。19世紀末期,人類發現了神經系統中結構與功能的基本單位——神經元[18],經歷幾十年的探索和發展,人們對神經元的連接方式、作用機制等有了一定的認識。[19]恰逢這一時期電子學取得突破性進展,計算機也隨之誕生,構建一個電子的“神經網絡”來模擬神經元活動,成為當時人類模擬智能最直接的方式,這就是“聯結主義”。當時最具代表性的是感知器,[20]它是一個單層神經網絡,能完成簡單的圖像分類任務,比如區分三角形和圓形,掀起了第一波人工神經網絡的熱潮。可惜單層神經網絡很快就遇到挫折。首先,20世紀60年代的算力發展程度非常有限,當時算力最強的計算機是IBM 7090,內存和處理速度甚至遠比不上現在的普通筆記本電腦,只能處理很小規模的數據,無法為人類設想中的神經網絡算法運行提供支撐。其次,單層神經網絡能執行的任務非常有限,與人類想象中的“人工智能”差距甚遠,當時也沒有發展出建立多層神經網絡的有效算法,更無從談起算法是否通用。尤其是1969年,AI領域知名科學家馬文·明斯基等發表《感知器》[21],對單層神經網絡算法的局限性進行了證明和批評。最后,大眾對于人工智能的熱情冷卻下來,神經網絡領域的學術研究近乎停滯,引發了AI發展的第一次寒冬。

利用電子設備模擬生物腦的聯結主義遭遇挫折,但科學家們仍在嘗試另一條路徑,那就是拋棄大腦的生物屬性,直接通過模擬邏輯來實現“智能”,這就是符號主義。符號主義者認為,智能可以理解為按照邏輯規則來操作的符號運算。[22]如果把知識提煉成規則,再把規則轉化為計算機符號,將這些符號輸入計算機,就可以讓計算機掌握人類的邏輯,從而表現出“智能”,其中最為典型的代表就是專家系統。如世界上第一個專家系統DENDRAL,[23]它可以根據輸入的化學分子式信息來分析判斷有機化合物的分子結構。在符號主義盛行階段,各類型的專家系統陸續推出。然而,符號主義的發展很快也遇到了阻礙。首先,從理論層面來說,專家系統很容易就會面臨規模爆炸的問題,[24]比如旅行商難題,給定多個城市和每兩個城市之間的距離,求解途經每個城市一次后返回出發城市的最短路徑,隨著城市個數的增加,遍歷所有情況來尋找最短路徑的計算復雜度急速上升,計算機系統需要耗費大量時間來求解,甚至理論上需要幾十年或幾百年才能解出答案。其次,專家系統里面所有的規則都需要預先輸到系統中。一方面,把現實生活中的問題和解決方案拆解為“如果符合某條件,那么推出某結論”的規則,工作量巨大;另一方面,當遇到新的場景時,如果沒有提前輸入的規則,系統就可能無法運作。的確有人嘗試過輸入所有規則,構建一個“無所不能”的專家系統,如1984年美國微電子與計算機技術公司的Cyc項目,[25]到21世紀初該項目停止前已累積百萬數量級的概念和規則,[26]但“無所不能”的目標卻依然遙不可及。隨著這些缺陷逐漸暴露,人們發現專家系統能完成的任務在廣度和深度上是有限的,到了20世紀80年代末公眾對人工智能的熱情再次消退,這讓AI的發展遭遇了第二次寒冬。

雖然經歷了兩次嚴重挫折,但人工智能的研究并未停下腳步,如果符號主義處理復雜場景時遇到規模爆炸的問題,那是不是可以先把AI的應用限制在簡單的小場景中?于是AI開發者們“退而求其次”,將AI的研發與應用聚焦在單一場景中,以此來優化AI處理某些具體任務的表現,這就是行為主義的思路。在這種思路指導下,一系列機器人項目應運而生,如1990年成立的iRobot公司推出的用于太空探索的六足機器人Genghis、水下掃雷機器人Ariel和后來的家用掃地機器人等。行為主義回避但并未解決AI智能遷移能力弱的問題,比如掃地機器人的算法很難用來處理翻譯或者圖像識別的問題。針對不同的場景任務,行為主義還是需要重新預先編程并設計新系統來完成特定的任務,無法發揮規模效應,這也限制了AI的發展和應用。

小場景嘗試讓AI發展經歷了一段過渡期,智能探索幾經曲折后,隨著算法和算力的進步,聯結主義再次站在了AI舞臺的中央。雖然早期聯結主義陷入低谷后神經網絡研究遇冷,但學者們沒有完全放棄對該領域的研究,陸續研發出可用于聯想記憶的Hopfield網絡、[27]解決多層神經網絡計算問題的反向傳播算法、[28]前饋的卷積神經網絡(CNNs/ConvNets)[29]等。而杰弗里·辛頓于2006年提出了深度學習的概念,[30]進一步推動了聯結主義的發展。深度學習在機器學習的基礎上引入了模擬人腦的多層神經網絡,用更強大的計算能力讓機器從大規模數據中提取特征,神經網絡層數越多,機器對輸入特征的抽象程度越高,對輸入信息的理解也越準確,更接近于人腦對信息的認知方式。此后,深度學習在計算機視覺、自然語言處理等領域都有較好表現,如深度學習模型在ImageNet圖像分類挑戰賽中將錯誤率降低了近一半,擊敗傳統模型[31]等,深度學習成為重要探索領域。不過當時發展出的AI仍是適用于特定領域的,如打敗圍棋世界冠軍的AlphaGo無法將下棋的優越表現遷移到其他領域。

前幾輪AI的發展存在一個相似但常被忽略的問題,那就是系統通用性的缺失,智能模擬系統的設計往往只針對特定智能類型,很難實現跨領域智能遷移,更不要說同步利用不同類型的信息對世界真理進行更好的歸納與總結。如前所述,人類智能可以分為不同類型,比如語言智能、邏輯數理智能、音樂智能等。傳統模擬智能的思路就是針對不同類型的智能設計不同的模擬系統,讓AI掌握解決特定智能問題的能力。這導致不同智能的AI模擬之間存在藩籬,AI無法像人腦一樣對不同類型的信息進行通用性處理,阻礙了AI實現不同領域間規律的類比和遷移,限制了AI對現實世界的理解范圍。或許因為沒有意識到這一隱性的問題,通用模型一直都沒有成為AI研究的重點。如果有一種通用模型,能讓AI在同一框架下對不同類型的信息進行處理,更全面地總結萬事萬物背后運行的規律,那么AI就有可能更逼近世界真理,迎來智能模擬水平的提高。

(三)新架構“意外”突破,AI邁入通用模型時代

不同于前幾輪AI熱潮,本輪AI發展在處理不同類型信息的通用模型方面取得了重要的突破。2017年,谷歌團隊提出了Transformer,[32]本意只是解決當時機器翻譯存在的長句信息丟失、計算效率低等問題,但在隨后的應用中人們越來越發現其具有跨越智能模擬藩籬的能力。Transformer是一種深度學習架構,基于多頭自注意力機制,處理信息與人腦類似,能忽略次要細節、專注于關鍵信息,可以捕捉序列中長間隔詞語間的關系,從而盡可能識別序列中的信息。同時,多頭自注意力機制還能形成多個子語義空間,使模型能夠同時關注輸入序列中的多個不同位置,捕獲更豐富的上下文信息。此外,Transformer的多個注意力頭可以并行計算,不需要等待前面的單詞計算完成,可以更高效地處理大規模序列數據。這些特點讓Transformer展現出了強大的長序列數據處理能力,它可以很好地完成機器翻譯任務。雖然一開始人們主要使用Transformer來處理文本數據,但很快研究人員就發現,很多類型的數據都可以轉換為Transformer可處理的數據模式,這讓Transformer表現出了通用模型的潛力。

Transformer一般通過“詞元(token,也稱‘記號’)化”處理數據,它將數據轉換為可以被機器處理的標準化的序列數據,語言、動作、影像等各種符號化或者非符號化的數據都可以“詞元化”。如文本數據本身就是以序列形式存在的,視頻可以看作時空維度上的多個圖像序列。在處理不同類型數據時,Transformer可以將文本數據轉換為詞元,將圖像轉換為曲面片(patch),將機器人的動作控制轉化為機器人詞匯[33](robot vocabulary)等,觸覺[34]和味覺[35]等數據的處理也在探索中。此前,對不同類型數據信息的處理是由不同模型進行的,這導致了智能模擬的分割,如從文本數據中總結規律可以學習到語言智能,從音頻數據可以學習到音樂智能,從數學中的幾何定理、證明等數學數據可以學習到邏輯數理智能等[36],而由于Transformer這一算法架構可以用相對一致的思路處理各種類型的數據,所以其將這些智能的模擬統一到了一個架構之下,并最終推動數字智能[37]和具身智能[38]的快速發展(見圖1.4)。

圖1.4 Transformer對不同智能模擬間藩籬的打破

資料來源:中金研究院。

通用模型的出現打破了多類型信息處理的壁壘,這是AI發展里程碑式的突破。對于單一數據而言,Transformer具備了總結這些數據中蘊含著的高維度規律的能力。以文本數據為例,語言作為人類交流的工具,是人類思維的外化表現,因此語言文本中蘊含了人類已經發現的、總結好的那部分規律。Transformer將輸入的文字序列轉化為詞元,對應生成向量,映射到向量空間中。向量的位置、向量之間的距離,對應表達出原始文本中的含義和聯系,所以Transformer生成的其實是一個富含人類邏輯規律的向量空間。以“意大利的首都是羅馬,西班牙的首都是馬德里”這句話為例,某個國家的首都是哪里,這是人類總結出來的規律,這條規律在向量空間中表示為國家和首都之間相對穩定的方向和距離關系,“老鷹會飛,獵豹會跑”這類句子亦是如此。當基于Transformer的大語言模型處理足夠多的文本數據時,它就能挖掘到數據之間存在的這種較為穩定的聯系,表面上是從概率角度推斷出了句子里一個詞元后可能出現的詞元,實際上則是總結出了這種穩定聯系所代表的規律,且運用規律進行了預測。Transformer通用地處理多種類型數據信息,可以在更高維度上總結多類型數據所蘊含的規律,并對這些規律進行總結。如果說語言文本中蘊含的規律是人類思維的結晶,那么圖片、視頻、動作等數據中蘊含的信息則反映了世界真理在其他物理世界的投影。如大量熟透的蘋果從樹上落地的視頻,包含了物體在空間運動、重力等物理現象和規律,如果在此基礎上再增加蘋果落地的音頻、對蘋果和地面的觸感進行的文字描述等,并將這些不同類型的數據放到通用模型中進行處理,從多種類型信息中總結規律,模型就能更全面地理解這一現實世界中的現象,對它的認識也逐漸逼近現實世界的真實情況。而這種通過尋找不同類型信息間的共同結構,從而發現世界中不同事物聯系的方法,一定程度上也是創造力的來源。[39]如果說特定類型信息是從單一角度去反映真實世界,[40]那么通用模型處理多類型信息,就可以更全面地反映出真實世界,以此反推出來的規律與“世界真理”可能就會更接近。雖然AI通用模型的最終形態有可能基于其他更先進的架構,但可以說Transformer最先叩開了AI邁入通用模型時代的大門。

(四)規模定律:提升智能水平最好的答案?

如果說通用模型讓AI打破了處理不同類型信息的壁壘,拓展了人工智能的泛化和通用能力,那么給定AI處理信息類型,我們又該如何提升其智能水平呢?

歷史上出現過不同的嘗試,但規模定律似乎成了潛在的最佳答案。提高AI智能水平的一種思路是基于人類知識進行算法構建,這種思路往往假設智能體可用的計算資源相對固定,旨在提高對有限計算資源的利用效率,充分利用人類在特定領域的知識來設計算法,節省算力成本。另一種思路則是研究隨著算力的增加能持續提高性能的通用算法,發揮大規模算力的作用。[41]短期來看,第一種思路似乎能快速起效,但長期來看,第二種思路能令算法在算力增長中受益,可行性更高。原因在于摩爾定律驅動算力不斷發展,芯片性能指數倍增,隨著算力擴展,能利用大規模算力的通用算法性能逐漸提升,而那些無法進行擴展的特定算法則難以在算力資源的提升中受益,性能表現水平很容易被超越,當時設計的算法也就容易過時。而近10年來算力和數據規模的增長更加證明了第二種思路的優勢。據英偉達(NVIDIA)測算,過去10年GPU(圖形處理單元)處理能力增長了1 000倍,增長速度超越了摩爾定律[42],它將持續提高性能,互聯網的普及也使大量的數字化信息得以積累,為AI提供了算力和數據支撐。許多人開始相信擴大規模,即運用更多的算力、更多的數據來訓練更大的模型,或許是提升AI智能水平“最好的方案”,尤以當前活躍在大模型相關企業前線的部分科學家為代表。也許是受到這一思路啟發,人工智能研究公司OpenAI于2020年發現,隨著模型訓練過程中累積的算力、參與訓練的數據量、參數量的增大,模型性能將平穩、可預測地提升,即模型的效果更好。[43]在后續研究中,還發現規模定律適用于多種模態[44]、具體的下游任務[45]等。當大模型擴張到一定程度的時候,還會出現“涌現”[46]現象,涌現是指模型突破某個規模后性能顯著提升,表現出小模型不具備的能力。盡管人們當前對于模型涌現能力的評價指標有技術爭議,[47]不過爭議多存在于數學方法層面對涌現現象的度量,并沒有否定模型會在規模增大時突然增加性能這一現象。對于通用模型而言,其如果呈現出規模定律特征,便意味著繼續擴展規模會帶來智能水平的提升,其對規律的刻畫也能更接近世界真理的“本來面貌”。

不過,作為經驗定律,規模定律并非毫無爭議,擴大規模是不是提升智能水平“最好的方案”仍然有待探索。一方面,現在已經出現了潛在高質量數據的短缺問題,有估測認為,全球高質量文本數據在2026年前可能出現供不應求,[48]能否有支持規模持續擴展的數據量是未知數,不過運用合成數據、待收集的其他類型數據可能是一個解決思路;另一方面,規模定律下擴展規模對模型精度的線性提升是否存在邊界,也是當今學術界和業界暫時無法解答的問題。而且,規模定律中還存在邊際收益遞減的問題,當模型要素規模比較小時,擴展規模帶來的收益明顯,而隨著規模越來越大,改進模型的效果可能不那么明顯。更進一步地,有觀點認為,規模定律與人類大腦運用少量樣本、快速發現規律的方式背道而馳;[49]還有觀點認為,過度強調規模可能會忽視知識、推理本身的重要性[50],等等。激烈的討論可能代表著沿著規模定律提高AI性能的路徑仍有改進空間,規模定律是推動AI提升性能的路徑,但也可能存在其他路徑。

規模定律是基于技術層面的討論,但也隱含著經濟層面的規模要求,大國享有規模優勢。規模定律意味著AI大模型的研發需要大量資源投入,大國可以發揮規模優勢。算力驅動模型基于大量高質量數據進行規律總結,參數和數據的大幅增長,使本輪AI通用模型在訓練階段需要執行更大的矩陣運算,這意味著大量的GPU投入。為了滿足更新模型、增加功能產生的算力需求,AI大模型持續轉向性能更好、含有更多芯片的大型計算集群。此外,持續優化算法架構、研究合成數據、采集新類型的多模態數據、大模型訓練的工程調優等都需要充足的人才投入。大國憑借規模優勢可以使多個主體分攤模型訓練高昂的固定成本,擁有更多的人才儲備,從而可以更快突破AI性能閾值,達到更好的效果。

總結來看,在當前通用模型突破與算力和數據的支撐下,AI更加接近世界真理,從虛擬世界走向真實世界,未來的AI也將對人類生產生活產生深刻影響。當前AI找到了展現出通用模型潛力的架構,以及規模定律所蘊含的提高模型智能水平的方式,隨著大量多模態、高質量的數據被收集和清洗出來,用通用模型訓練,可以深入挖掘出越來越多的規律,并可利用跨模態的數據完成對真實世界各個維度的刻畫,從而逼近世界真理。如此發展之下,數字智能和具身智能系統結合,在越來越融入人類社會的同時,將影響人類的生活習慣、思維方式甚至認知。我們認為,一場智能浪潮正在醞釀,AI也將更加深刻、更加顯著地對人類社會產生變革性的影響。

二、“研發—應用”加速循環,智能融合浪潮已來

從市場預期和企業盈利來看,當前AI技術發展或已跨過S曲線的第一拐點,“研發—應用”的循環迭代正在加速,在規模定律和新摩爾定律的支撐以及市場競爭的激勵下,智能成本持續下降,AI與產業的智能融合浪潮已經襲來。

(一)通用模型賦予AI更強融合潛力

進入通用模型時代,AI呈現出成長為一項通用目的技術的趨勢。歷史上,包括蒸汽機、電力和IT(信息技術)在內的通用目的技術在廣泛融合產業的過程中表現出三個特征:[51]一是應用具有普遍性,使用范圍并非局限于單個產品或行業;二是催生次級創新,為各行業相對成熟的現有技術提供新的活力;三是技術上持續改進,隨著成本下降或性能提升適用于越來越多的場景。從三個特征來看,通用模型時代的AI與產業融合的能力較之前可能更強。

應用范圍方面,智能模擬的通用性使本輪AI技術具有更高的產業兼容性,將提升AI的滲透度。本輪AI能夠理解指令并自主學習,傾向于對人而非特定機器的替代。各行業幾乎都有人的參與,需要完成的任務都與人的智能相關,這使本輪AI技術相較其他技術具有更高的兼容性。隨著AI模擬智能場景的擴張,AI與人可以完成任務的重疊度增加,且AI逐步覆蓋對認知能力要求更高的復雜任務集。[52]生成式AI在各行業均出現了加速部署趨勢。[53]百度文心一言大語言模型由于具備信息處理和解決問題的通用智能,對外發布一周內就有互聯網、傳媒、金融、汽車、醫療、教育、房地產等多個領域的數百家企業宣布加入生態,[54]體現出AI行業應用的普遍性。對比來看,電力和IT的采用是分部門、有次序進行的,率先采用電力的部門是此前嚴重依賴蒸汽動力的印刷業、電機業和交通業,而木材、食品制造等部門的電氣化進程則滯后了近20年才開始;[55]而此次AI技術提供的通用智能在一開始就被眾多行業積極采用,各行業開始采用的時間差距并沒有那么大,因此整體上AI對經濟社會的影響也可能更深遠。

創新催生方面,本輪AI正在推動次級創新的發生,甚至在研發端開啟了科學研究的新范式。就像蒸汽機和電力等通用目的技術的嵌入推動了各類機械制造工藝的創新,AI技術也與各行業相對成熟的現有技術結合,產生了自動駕駛汽車、醫療影像分析系統和個性化推薦商業軟件等次級創新。不僅如此,與電力和IT促進創新時人類處于操控和主導地位不同,AI還可以直接參與研發端的科學發現過程,以相對更高的自主性和創造性與人類進行更深入的協作,通過改進搜尋和推理過程來賦能科學研究的各個階段,從而完善大尺度、高精度、高成本的研究范式,[56]加速各個領域的創新。澳大利亞學術研究機構CSIRO稱,截至2023年,超過99%的研究領域曾發表涉及AI的學術論文;《自然》雜志發現,各學科發表論文中與AI相關的比例加速提升,2023年在標題或摘要中提及AI或AI相關關鍵詞的論文占比為8%,而10年前僅為2%。[57]

技術改進方面,在通用模型的推動下,本輪AI跨越了智能藩籬,能力不斷提升。當前的AI在語義分析、數理邏輯、編程等方面的測試得分逐步提升;[58]通過允許更大的上下文窗口和集成外部搜索引擎等方式,AI打破了數據時間、容量和內容的限制,從而越來越精準地理解用戶意圖,進一步提高了通用智能水平。不僅如此,從GPT-4到GPT-4o,AI模型還通過將輸入和輸出數據的形式拓展至文本以外的圖像、音頻、視頻等模態,貼近人類感知世界的方式,多路交叉驗證,全面理解高維現實世界,顯著提高了能力。[59]AI正在跨過越來越多應用場景的智能門檻,從最初的基礎翻譯和預設問答,到更復雜的程序編碼、實驗操作、金融分析,再到更開放的藝術設計、影視創作,產業適用性隨著技術改進不斷提升。

從應用范圍、創新催生和技術改進角度看,當前的AI具有成為通用目的技術的特征。不過值得注意的是,通用目的技術是一個后驗的概念,各行各業的采用、次級創新的催生、技術的迭代改進都需要時間的沉淀和檢驗。技術路徑的不確定性,市場的理解和接受程度,配套的基礎設施和知識庫,等等,這些都會影響一項技術能否擴散、需要花多長時間完成擴散。那么,本輪AI技術發展到了什么階段,又將帶來多大程度的社會經濟影響呢?

(二)跨過S曲線第一拐點,智能融合蓄勢待發

技術發展通常要經歷三個階段,生命周期遵循“S曲線”(見圖1.5)。S曲線刻畫了技術的累計采用率——在初始階段擴散較為緩慢,隨后進入加速期,最終放緩并達到飽和。從經濟學角度看,擴散速度的變化主要受到創新成本和收益的影響。在早期階段,新技術本身由于尚不成熟而面臨著很多未知因素,需要投入大量的研發費用進行試錯,并配套開發專門的材料、工藝和基礎設施,創新成本非常高昂;而消費者可能尚不了解新技術的價值,或不愿為之支付高價,導致需求較低、收益有限。此時,技術與產業的融合往往處于入不敷出的“燒錢”狀態,由于缺乏相對確定的盈利能力和應用前景,也難以吸引充足的資金、人才等外部資源,技術發展和市場擴散速度較慢。隨著技術改進和市場磨合,實現同等性能的技術應用成本大幅下降,同時市場需求逐步增長,技術與產業的融合最終將越過創新的盈虧平衡點,開始盈利。自此,盈利的再投資,疊加外部資源在識別出潛在機會后的進入,將加速技術改進和市場擴張,這又將進一步增加盈利并吸引新進入者,從而實現“研發更先進的技術—獲取市場利潤—支撐進一步研發”正向循環下的持續迭代。最后,當大多數市場用戶采用了該技術,且技術逐漸成熟時,盈利模式由搶占新市場轉為存量競爭、盈利增速放緩,同時由于技術改進的邊際成本增加,技術進步的速度將開始減緩,技術擴散速度將再次變慢。

圖1.5 “研發—應用”正向循環下技術迭代和循環的S曲線

資料來源:中金研究院。

基于上述分析,判斷一項新技術行至S曲線何處,主要在于其是否具有較為確定的市場需求(即盈利預期),或產業研發者是否已經開始盈利以及潛在進入者是否大量投入資源。基于以下幾個理由,我們判斷本輪AI技術已經跨過S曲線的第一拐點。

首先,本輪AI技術已經出現較為確定的市場需求。從專利授權的角度來看,AI商業落地場景正不斷擴張(見圖1.6),如醫療保健業的疾病診療和新藥開發,金融業的欺詐檢測和輔助投資,制造業的人形機器人協助搬運,零售業的個性化推薦和庫存管理,交通運輸業的自動駕駛,等等。同時,一些商業化的項目已經具備了成規模的用戶群體。以OpenAI的ChatGPT為例,其全球用戶數在產品推出5天內破百萬,不到3個月破億。[60]

圖1.6 全球AI發展趨勢

資料來源:Our World in Data,Stanford University,中金研究院。

其次,AI相關企業的盈利能力顯著提升,吸引潛在進入者入局加碼。仍以OpenAI為例,其盈利已從2022年的2億美元提升至2023年的20億美元。[61]廣泛的盈利場景正在吸引越來越多廠商將產品與AI融合,微軟在2024年5月宣布將AI助手Copilot全面融入Windows操作系統,并與合作伙伴戴爾、惠普、聯想和三星等合作推出一系列搭載高性能AI處理器的PC(個人計算機)設備。[62]據IDC(國際數據公司)預計,全球AI PC出貨量將從2024年的近5 000萬臺增長至2027年的1.67億臺,屆時可能占到所有PC出貨量的近60%。[63]AI領域自2021年起出現了私人投資額和新成立公司數的明顯提升(見圖1.6),其中生成式AI領域2023年吸引了252億美元的私人投資,接近2022年的9倍。[64]而激烈的市場競爭,將不斷推動企業進行“任務驅動”的快速技術迭代,使S曲線呈現出陡峭的上行趨勢。

最后,市場對AI技術進步仍然充滿信心。無論是通用模型的進步,還是規模定律仍未遇到瓶頸,都讓產業研發者們對AI能力的提升和商業化落地充滿期待。已經實現商業化落地的AI,比如生成式AI或者人形機器人不會再走回頭路,這是AI實現與產業融合的基本盤,研發與應用的循環迭代已經形成。此外,依據算力新摩爾定律,可用的計算資源將隨時間推移遞增,每隔數年(有學者測算為5~10年[65])將出現一個數量級的改進。而人類對未來AI能力提升的預期,將進一步推動AI與產業融合的資源投入,加速研發與應用的循環迭代。

跨過S曲線的第一拐點預示著“研發—應用”正向循環的開啟,我們將迎來產業與AI快速融合的階段。至于本輪AI技術何時迎來第二拐點,目前還較難判斷,可能尚有較長一段時間。從通用目的技術擴散的歷史經驗來看,若以“獲取電力服務”和“擁有個人計算機”的累計家庭比例來衡量電力和IT的采用情況,則在通用目的技術出現的第35年前后,需求端采用率約達到70%時,技術越過S曲線第二拐點。[66]然而,如果遇到高質量數據、能源短缺等瓶頸,AI技術發展速度或將受到拖累,甚至提前跨過第二拐點,進入平緩期。

(三)智能成本下降是核心,對經濟與社會影響深遠

AI新變革的核心是智能成本的快速下降。從智能類別來看,無論是數字智能還是具身智能,AI模擬智能的成本都在快速下降(見圖1.7)。AI目前在一些自然辨識、數理邏輯和語言智能任務中已達到人類平均表現且智能成本已下降至低于人類勞動者。例如,一名平面設計師創建一個動漫角色大約需要一小時,其時薪超過100美元,而人工智能完成相同的任務只需要0.01美分和1秒。[67]從部署AI以獲得智能的成本拆分來看,性能要求決定的訓練成本、任務量決定的執行成本、配置和維護要求的工程師成本三個部分都在隨時間推移快速下降。[68]訓練成本主要取決于算力成本和數據成本,在給定性能要求即參數量和數據量確定的條件下,據中金公司研究部估測,硬件、軟件、算法和計算架構的進步將共同推動單位計算成本持續下降超過99%,[69]收集或合成數據的成本在長期也將隨著數據的開放與共享以及數字技術的進步而下降。以前沿的AI基礎模型為例,GPT-3水平的生成式模型的訓練成本從2020年的460萬美元下降至2022年的45萬美元,年降幅約為70%。[70]給定任務量的條件下,執行成本未來也將進一步隨著算力成本下降而不斷下降,如OpenAI對GPT-3和GPT-4的API(應用程序接口)推理定價正在加速下降;[71]又如人形機器人的成本也從2023年的每臺5萬~25萬美元(低端版本至最先進版本)下降近40%至2024年的3萬~15萬美元,[72]馬斯克還表示特斯拉Optimus人形機器人的最終成本將降至2萬~2.5萬美元。[73]工程師成本是公司雇用工程師配置和維護AI產品所支付的工資。隨著大模型廠商針對客戶需求推出輕量級、低延遲的版本(如Gemini 1.5 Flash)并側重改善不同任務或語言下的模型性能,基礎模型的場景貼合度提升,垂類模型的接入和微調僅需要小型工程師團隊,這有助于降低工程師成本。相較人類接受教育和技能培訓的學習訓練過程,AI的遷移成本(即邊際智能成本)非常低,在進行少量微調即可復用模型的相似場景間遷移的成本甚至趨近于0。而這都意味著,在研發與應用的循環迭代期間,智能成本的下降可能是最重要的特征。

圖1.7 2019—2024年AI模擬智能的成本走勢

注:2024年中國協作機器人均價為預測值,OpenAI每100萬個詞元輸出成本參考2021年GPT-3、2022年GPT-3 Davinci和2023年GPT3.5-Turbo定價。

資料來源:高工機器人產業研究所,OpenAI API Pricing,Dibia(2023),中金研究院。

智能成本的快速下降可能給社會、經濟和文化帶來深遠影響。從生產端看,智能成本的下降將人類從常規智能任務中部分解放出來,人類與AI的再分工有助于緩解勞動力不足或增速放緩的限制。正如此前自動化機器人對常規體力勞動者的取代,我們認為理論上本輪模擬通用智能的AI或在成本降至人類勞動者以下后發生類似的取代。目前AI智能水平尚未全面達到人類水平,這種取代可能不是完全的,主要限于部分重復性和規則化的智能任務。關于AI與人類勞動者分工的最終界限,目前尚有較大爭議,以斯坦福大學教授李飛飛為代表的一派認為[74],人類將隨著AI技術的演進動態更新和精進能力,并借助AI躍遷到更高的智能水平,其間可能由于AI發展速度快于人類技能調整速度而出現結構性失業,但最終人類將適應AI技術并用其賦能,從而持續提高勞動生產率。也有以OpenAI聯合創始人山姆·阿爾特曼(Sam Altman)為代表的另一派認為[75],AI模擬的通用智能將在一些部門超過并幾乎完全取代人類勞動者,進而導致經濟表現出“鮑莫爾病”,即人類越來越多地集中于AI相對不擅長且效率相對較低的部門,最終AI全面達到人類智能水平時,人類或將不再需要工作。無論是何種結局,作為一項通用目的技術,AI都具有推動經濟增長和調整就業結構的巨大潛力。從消費端看,智能成本的下降將激發新的智能需求,進而帶來深遠的社會經濟影響。IT革命時期信息傳播成本和計算成本快速降低,涌現出電子商務、社交媒體、流媒體服務等大量數字內容分發和計算需求。類似地,在AI技術的演進過程中,已有的智能需求將隨之調整,如精準推薦和定制的個性化需求相對標準化需求可能提升,同時出現各類意想不到的新智能需求,如人類與虛擬數字人的情感互動等。除了經濟角度的需求擴張和結構調整,AI技術進步還將產生復雜的社會影響,比如虛擬數字人可能緩解人類孤獨、抑郁等心理問題并滿足其情感需求,但也可能成為滋生詐騙活動的溫床,人機倫理問題也可能變得更加尖銳。[76]

總的來講,AI推動的智能融合浪潮具備了重新定義國際競爭格局的潛力。電力革命之前,英國作為“日不落帝國”曾享受國際領導者帶來的政治經濟溢價,但隨著電力革命在美國的擴散,英國被美國趕超,這些溢價也逐漸消失。技術變革為各國打開新的競爭窗口——領先者希望在技術變革中維持領先地位,后發者希望通過技術變革得以追趕領先者,技術變革是各國競爭的重要陣地。本輪AI變革也是如此。那么,各國的AI發展格局如何,誰又會引領這一輪智能融合浪潮?

三、誰將引領這場智能融合浪潮?

(一)“研發—應用”迭代是基礎

從歷史經驗來看,在通用目的技術越過S曲線第一拐點后,哪個國家可以引領新一輪技術與產業融合浪潮,主要取決于誰會在新技術的“研發—應用”循環迭代中勝出。英國就是通過撬動研發與應用兩端并使之相互促進從而引領第一次工業革命的。蒸汽機的發明和改良是具有基礎性、顛覆性的創新,之所以發生在英國,與其當時作為世界大國的積淀密不可分。首先,英國有17世紀歐洲科學革命帶來的理論基礎,如牛頓等人的力學理論成為后來工程技術發展的基石。其次,英國本土早期的技術積累也相當豐厚,在第一次工業革命前夕,英國在采礦、冶金、機械制造等領域也已積累了豐富的技術和工藝,如,亨利·科特發明的“攪拌”和“碾壓”法,使煉鐵功效提高數十倍,為蒸汽機的大規模生產提供了材料基礎,此外,18世紀英國機床的發明也使得復雜機械設備的制造成為可能。最后,英國的人才積累也不容小覷,當時的英國有大量像詹姆斯·瓦特這樣具備實踐經驗和創新精神的工匠或工程師,瓦特正是在紐科門蒸汽機的基礎上做了改進,通過增加冷凝器和改進氣缸,顯著提高了蒸汽機的效率。這一系列的優勢保障了英國在技術革新浪潮初期取得研發端的領先地位。而英國最終引領第一次工業革命,還離不開其應用端發展對創新形成的整體支撐。在技術越過第一拐點后,英國存在著充足的應用空間,喬治·斯蒂芬孫在蒸汽機技術的基礎上發明了在鐵軌上運行的蒸汽機車,大大提高了英國陸路運輸效率,而鐵路的建設和普及,再疊加蒸汽機在運輸、制造業等多領域帶來的革命性變化,進一步推動了工業化和城市化的進程,又在此基礎上激發了新一輪的初級創新,各行業生產力的快速提升真正意義上使英國以“世界工廠”的身份成為第一次工業革命的引領者。

研發與應用的最早發生有可能不是在一個國家,在第二次工業革命中,美國則通過引用技術和應用成果反哺實現了超越。電力的初級創新最早集中發生在19世紀的歐洲,尤其是德國和英國。英國科學家戴維在1809年發明了最早的電光源之一電弧燈;法拉第在1831年發明的電磁感應裝置,是現代發電機的前身。然而,產生大規模影響的次級創新卻發生在美國,托馬斯·愛迪生和尼古拉·特斯拉在電燈、電力傳輸和電動機等方面的發明奠定了現代電力系統的基礎,進一步推動電力技術跨過第一拐點。歐洲的電力技術通過人才交流、技術轉移和跨國公司的全球布局,迅速傳入美國。美國擁有廣闊的疆域和大量的人口,這為電力技術的應用和擴展提供了廣闊的市場,加上美國當時的經濟快速增長,資本迅速積累,大量資金得以投到電力基礎設施的建設中,這些基礎設施的完善反過來又促進了電力技術的進一步發展和應用。美國在原有技術的基礎上,加速進行大規模的工業應用和改進,例如,愛迪生和特斯拉發明的電力設備與系統被廣泛應用于城市電網建設、家庭電器等多個領域,顯著提升了技術的實際應用價值,推動了電氣化進程,使得美國制造業和服務業的效率顯著提升,工業產值在20世紀初迅速超越歐洲各國,成為全球最大的工業國家。

電子信息領域也存在“研發—應用”迭代、二者互促引發技術革命引領者變位的生動案例。始于20世紀50年代的半導體產業發展至今,研發制造領域的引領者幾乎群集于美國,由此支撐的各項應用創新,如智能手機、電子商務、移動支付也大都肇始于歐美。然而,中國基于次前沿和成熟技術,在應用層后來居上,孕育了抖音、微信、拼多多等囊括社交網絡、生活服務、電子商務、共享業務等的許多具有全球影響力的互聯網巨頭。自2008年以來,中國電子商務持續快速增長,交易額占全球的比例從不到1%發展到10年后的40%以上,超過法國、德國、日本、英國和美國的總和。[77]中國的移動支付在采用率和交易額方面也由于支付寶等的廣泛使用完成趕超,居于世界領先地位。大市場還帶來多梯度、多層次結構的消費群體和消費場景,又反哺新一輪的初級創新,從而強化了“研發—應用”推動的循環迭代。

那么本輪AI與產業融合的浪潮中,研發端與應用端的循環迭代究竟取決于哪些因素呢?

(二)算力、數據、人才、金融推動研發端創新

算力、數據和算法是當前AI研發端的三個要素,三個要素相互聯系、相互影響,共同決定了AI技術進步的水平,而金融支持對撬動市場力量以支持技術躍遷也同樣關鍵。與其他技術有所不同,AI領域的知識具有更廣的多樣性和更高的復雜性,且其知識庫正處在一個持續快速擴張的狀態中,既包括與“科學創新”相關的理論知識,如數據科學、算法理論、統計學等專業基礎知識,又包括與“經驗創新”相關的實踐知識,這在調整參數、模型訓練過程中十分重要。[78]與便于傳播的理論知識相比,偏重“工匠”經驗的實踐類“知識庫”較難獲取、分解和轉移,后來者想要完全依靠自身研發對這些知識進行吸收存在較大困難。此外,由于知識本身還具有規模報酬遞增特征,即隨著知識積累的增加,知識的生產效率不斷提高,由此帶來的經濟效益會不斷增加,[79]在硬件基礎、數據、人才和金融支持等方面有長期積累的先發者因此會筑起較高的優勢壁壘。[80]

算力在AI時代承擔著重要角色,但其提升依賴高性能芯片的發展,核心技術壁壘較高。進入深度學習時代后,AI算力提升的曲線相較以前更加陡峭。2010年前,訓練AI的計算量每21.6個月翻一番;2010年以來,在最大的AI模型訓練中所使用的計算量大約在6個月內翻倍,2010—2023年已增長了3.5億倍。為了獲得AI性能的整體提升,需要持續投入大量的硬件GPU。而在芯片領域,首先,芯片制造是復雜的系統工程,在設計、制造、封裝測試等環節中,該領域的傳統領先者積累了大量知識,形成了技術壁壘;其次,美國GPU領先全球,后發國家受到一定程度的制約,追趕存在一定難度。根據IDC測算,2023年中國智能算力規模達到414.1EFLOPS(每秒1018次浮點運算),同比增長59.3%。但從國際比較來看,2024年中國全國智能算力規模或低于互聯網公司Meta所擁有的英偉達高性能計算芯片H100算力。

數據是AI研發層的“養料”和“教材”,同時數據也是AI性能和表現的“檢驗器”。在AI研發競爭中,除了數據規模外,數據質量的重要性也日益凸顯。高質量數據集對于優化AI模型表現十分重要,不過,有關數據質量高低的定義是動態的,隨著AI發展,其能力不斷增強,決定了其對所需數據“養料”的要求也在不斷變化。在大語言模型時代,AI已經呈現出初步的文本理解潛力,Sora(OpenAI研發的一款文本生成視頻大模型)的突破不僅呈現出AI多模態交互的能力,也展現出其能理解世界的跡象,這意味著當前AI的發展目標已不僅僅是對人類“思維”的模擬,而且是全面地實現人類與現實世界的交互。古納塞克等人提出,在大語言模型中,高質量的預訓練數據應當類似人類的“教科書”,這要求數據庫具備數據儲量充足、多樣性高、精準度高、清晰明了等特征。[81]隨著AI訓練數據上升到圖像和視頻維度,高質量數據或更偏重由機器直接捕獲的未經人類創作的圖像、視頻等形式,數據的維度也越發多元,觸覺、味覺、嗅覺等數據將進入AI訓練數據集,人類或將更少參與數據的獲取過程或記錄和傳輸的中介過程。在研發端對更高質量、更多維度、更大體量數據的需求激增的情形下,大國憑借規模優勢將較為自然地形成先發優勢,為未來AI發展所必需的數據挖掘提供更堅實的基礎。但大體量數據只是產生高質量數據的一個條件,數據的收集、清洗、標注、驗證和合成等步驟對優質數據的形成也十分關鍵,而在這些技術過程中所積累的知識往往不易傳播,它們最易在掌握前沿技術的大國形成聚集,從而強化AI研發層面的優勢。[82]

算法是AI研發的核心,高技術人才是保障算法突破的關鍵,而人才聚集效應鞏固了先發國家的優勢,加大了后發國家追趕難度。隨著技術的發展,AI需要解決的任務變得更加復雜,傳統算法難以滿足醫療、金融、交通等廣泛場景的不同需求,數據量的大幅增長也對提高信息處理的準確性和效率、減少計算資源浪費提出了更高的要求,這亟須算法的突破性創新。算法發展需要具備專業知識和創新能力的高技術人才,他們可以為算法的發展提供新思路、新方法,是推動算法突破的主體力量。然而人才數量未必能充分轉化為突破性創新產出,人才質量尤為重要。2010—2020年中國發表AI領域論文的科研人員數量全球領先,超出美國近20萬人,[83]但在本輪AI發展較為關鍵的研究領域卻落后于美國。由于知識庫的復雜性和人才培養的長期性,傳統技術大國往往具備技術累積優勢。一項新的算法提出后,相關理論知識易于傳播,可以在全球范圍內流動,但前沿算法人才會產生顯著的集聚效應。人才聚集之后,他們可以更容易地分享實踐知識、技能和研究成果,促進知識溢出和跨領域整合,加速算法的發展和優化,提高研發效率,這進一步鞏固了技術引領地的人才優勢,同時激勵其繼續培養和吸引創新人才,為算法突破提供持續動力。據2023年統計數據,世界頂尖AI人才聚集的科研中心多數在美國,在全球排名前25的AI研究機構中,美國有15個,中國有6個。[84]此外,分析當前全球最具影響力的基礎模型(如OpenAI的GPT-4o,谷歌的Gemini 1.5 Pro,Meta的Llama 3,美國AI公司Anthropic的Claude 3等)所屬組織的核心技術人才網絡,可以發現,當前AI研發的頂尖人才仍主要聚集于北美,亞洲、歐洲等地的算法創新人才在不同程度上屬于北美人才集群的延伸。如果AI技術長期保持較短的技術周期,維持快速迭代,那么未來AI前沿研發人才或將仍然主要分布在少數技術規模大國,研發層面的優勢將主要被它們掌握。

市場激勵下的金融支持,對于AI研發并轉化為現實生產力而言同樣不可或缺。首先,在當前大模型快速發展階段,硬件采購、軟件開發、數據收集存儲等都需要大量資金支持,金融資本能為AI研發的基礎設施建設和維護提供保障。其次,以風險投資為代表的金融力量在支持AI初創和成熟企業的技術突破方面起到直接而關鍵的作用。許多AI領域的創新都由初創公司推動,而這些公司通常需要外部資本來幫其啟動和擴展業務,如人工智能公司DeepMind被谷歌收購前主要依靠多輪風投才得以專注于突破性深度學習的研究,OpenAI在2019年改制后也是基于微軟和風投機構的資金支持才開發出GPT-3等模型的。此外,風投等金融力量在AI芯片領域的投入也十分顯著,英偉達得益于資本市場的支撐,才能持續研發高性能GPU。另外,充足的資金支持還能讓企業和研究機構為研發團隊提供有競爭力的薪酬和福利,以留住頂尖AI人才。

(三)市場規模、政策環境支撐應用端融合

AI應用的發展并不必需最前沿的技術,較為成熟的技術不確定性較低,技術軌跡也更容易預測,即使是后發者也可以較為容易地抓住“機會之窗”,通過技術轉移、自研等方式獲取相關技術知識。同時,由于非前沿技術的應用難度低,只要能夠適應和抓住外部市場需求和制度政策變化帶來的機會,減少試錯成本,就能在應用端取得優勢。[85]大規模市場與健康的政策環境是AI技術越過S曲線第一拐點后,在應用端的兩大重要推力。

一方面,多元細分的大市場可以降低AI應用的門檻。從市場層面看,商業市場潛力大的行業更能夠發揮市場規模優勢。大國的市場需求多樣性較強,創新場景豐富,更易匹配成熟技術的各種應用場景,這為AI技術應用帶來更大的擴散空間,能更廣泛地刺激AI次級創新的產生。對于暫處落后地位的大國,其總體市場和細分市場規模均足夠大,可進一步攤薄次級創新的成本,支撐AI應用實現商業利潤,利潤又反哺應用技術的進一步創新,研發、應用形成正向循環,其有望快速縮小與領先國家的差距。

另一方面,支持性的政策環境則為AI次級創新的持續發展提供動力。在AI應用發展過程中,政策環境涵蓋了有政府引導和參與的治理監管整體方向、技術及倫理標準制定、人才培養體系、知識產權及隱私保護措施和國際合作政策等諸多方面。穩健、靈活、包容的政策措施能激發應用創新活力,為企業和研究機構創造可預期的市場環境。良好的法律和政策框架可以幫助企業在開發和應用AI技術時遵守法規,避免法律糾紛和用戶信任問題,從而較為順暢地實現廣泛商業化,如歐盟2024年通過《人工智能法案》,[86]為規范AI技術的使用、確保技術發展與道德規范相符提供了較為明確的依據,其基于風險程度對AI進行分類,要求高風險AI系統的開發者提供詳細的技術和合規評估文件,以確保系統的透明度和問責性。但鑒于該法案對高風險AI及數據使用、隱私保護提出嚴格要求,也在一定程度上帶來了增加技術開發應用的成本和時間、影響AI技術創新速度和市場競爭力的風險。

綜上,本輪AI浪潮的競爭格局尚在形成過程中,對于誰將占據引領者地位,我們還需要綜合考量各國在研發端和應用端的發展勢頭,前者主要依賴算力、數據、人才和金融支持的整體水平,后者則倚重市場規模和政策環境的支持效果,二者相互促進,才能持續推動AI創新,從而提升整體經濟動能。為此,我們專門構建了AI發展指數,以評估各國在本輪技術浪潮中的智能融合潛力和相對地位。

四、度量智能融合浪潮強弱——AI發展指數

如本章第二部分所述,達到S曲線的第一拐點后,研發端的技術改進和應用端的市場擴散將相互促進,加速創新發展。為了刻畫本輪AI浪潮中各國的發展潛力,我們從研發和應用兩個層面來衡量一個國家AI技術越過S曲線第一拐點后在經濟中引領智能融合浪潮的能力,并將其命名為“AI發展指數”。該指數旨在刻畫AI通過“研發—應用”正向循環發展的速度:研發層面的“技術活躍度”越高,AI可實現的功能和可結合的應用場景就越多,從而在市場競爭中越能快速地吸引和積累龐大的用戶群體,增加潛在的應用市場規模;應用層面的“市場友好度”越高,市場對AI的需求就越大,進而可通過體驗反饋和盈利反哺加快技術進步和擴散。AI發展指數為我們理解未來AI發展的影響因素,以及我國在國際競爭中的地位和優劣勢提供了思路。

(一)研發與應用并重,構建AI發展指數

AI發展指數從研發和應用兩個層面出發(見圖1.8)。基于本章第三部分的分析,我們構建了研發層面的“技術活躍度”指標,從算力、算法、數據和金融四個方面衡量一國AI技術相對于國際前沿的水平,以及應用層面的“市場友好度”指標,從暴露規模、擴散程度和政策環境三個方面衡量一國應用AI技術的潛力和成本。研發和應用相互促進,因而將二者標準化后進行幾何平均可得到“AI發展指數”,該指數反映AI在越過S曲線第一拐點后通過“研發—應用”正向循環發展的速度。

圖1.8 AI發展指數的構建框架

“技術活躍度”刻畫了各國AI研發端在算力、算法、數據和金融四個方面的稟賦情況(見表1.1)。算力方面,新一代AI系統依賴高性能計算,[87]同時,依據規模定律,AI訓練對算力的需求快速提升,主要依賴數據中心和云端網絡集中部署大規模算力,以獲得穩定性和可擴展的靈活性。[88]算法方面,頂尖AI人才是前沿AI算法的本源,將無形的AI算法知識轉化為落地產品的能力至關重要。數據方面,已有的和待收集的多模態、高質量數據共同構成了訓練AI的數據稟賦,同時獲取、使用和流通這些數據的制度環境也是重要的影響因素。金融方面,算力、人才和數據都需要大量資金的支持,高度不確定性和高投資門檻下,前沿AI技術的研發和落地尤其離不開商業性風投的支持,其為AI技術的持續突破提供動力。[89]特別地,算法和數據維度區分考慮了AI模擬的兩類人類智能:一類是不借助物理實體即可完成的智能操作,如處理信息、規劃推理等,訓練這類智能所用的數據基本已存在,如文本、圖像、音視頻等;另一類是需要借助物理實體來完成的,涉及真實物理空間中的位置移動、靈活操作等,所需的數據主要包括人類與環境互動時的動作行為數據等,大多數處于起步階段,需要有意去合成、生成和收集。

表1.1 “技術活躍度”指標

資料來源:中金研究院。

AI應用層面的市場友好度指標,主要由AI產業的暴露規模、擴散程度和政策環境三個方面組成。首先,“暴露規模”可由根據不同行業中可以使用AI進行替代或賦能的場景比例和國家產值的行業結構計算出來的一國理論上暴露于AI技術的GDP比例,再乘以按該國購買力平價計算的GDP得到。其次,“擴散程度”主要通過度量各國AI暴露產值的行業份額方差,來衡量AI應用的外部規模經濟效應,理論上技術應用場景越多、越分散,其帶來的外部規模經濟效應越大。最后,“政策環境”包括一國的AI戰略、監管質量、網絡安全、倫理準則等,它們都有可能影響AI技術的應用成本,所以我們在此也將它們納入市場友好度的考量范圍。[90]

(二)AI發展指數一覽

通過就20個全球經濟體量靠前的國家計算AI發展指數,我們發現,當前美國、中國位于第一梯隊,它們各自占據研發、應用相對領先優勢的全球AI競爭格局初露端倪(見圖1.9)。若將美國各指標標準化為1,則中國的AI發展指數為0.76,居全球第二,高于第二梯隊的德國(0.32)、日本(0.31)和英國(0.31)。研發層面,中國技術活躍度(0.50)相較前沿的美國仍有差距,但與第二梯隊的英國(0.16)、德國(0.15)和日本(0.14)相比展現出明顯的優勢;應用層面,中國的市場友好度(1.16)處于領先地位,主要受益于龐大的市場規模和均衡的產業分布。在決定AI研發和應用水平的要素稟賦方面,不同國家有相對擅長的方向。與中國類似的在應用層面具有比較優勢的國家包括印度、俄羅斯、巴西等,與美國類似的在研發層面具有比較優勢的國家包括英國、韓國、瑞士等。

圖1.9 AI發展指數測算結果

資料來源:IMF,世界銀行,中金研究院。

(三)各國優勢與面臨的挑戰

在此次智能融合浪潮引發的國際競爭中,中國整體上具有一定的技術優勢和發揮規模效應的空間,有助于在AI技術達到S曲線第一拐點后通過更強的“研發—應用”正向循環推進AI發展。那么,從拆分細項來看,我國在哪些影響AI發展的方面面臨限制,在哪些方面具備值得進一步發揚的優勢呢?

從研發端來看,高性能算力和數據可得性成為中國AI技術趕超的主要挑戰(見圖1.10a)。在算力維度,中國的高性能算力受到美國出口限制影響,目前自研芯片提供的算力性能高于美國設置的限制標準,但在國際上處于相對落后的狀態;[91]美國智能芯片迭代速度快,采取優先用最高算力性能的GB200芯片滿足國內需求、延遲面向全球供應的措施,并向他國供給次優算力性能的H100、A100芯片,從而有效拉開了和其他國家的算力性能差距。中國的規模算力部署,包括云計算和數據中心服務器等軟硬件的市場規模,位居全球第二,雖然與美國還有差距,但相較其他國家表現出明顯的規模優勢,能夠提供部分AI訓練和推理所需的大規模算力。在算法維度,中國整體表現顯著優于第二梯隊的德國、英國、法國,尤其是AI算法的前沿知識創新能力與美國相差不大,但算法集成與開發落地產品的能力或相對欠缺,截至2023年,中國的AI創業公司數量不到美國的三分之一。[92]在數據維度,中國具有規模龐大的數據生產者,歷史上已經積累了相對豐富的數據,對于AI所需的自動駕駛、人形機器人等領域的待收集數據,也具備一定的挖掘或合成能力。但中國在數據可得性方面仍有改善空間,數據的開放程度、治理框架和基建網絡等在一定程度上可能落后于歐美發達國家。在金融維度,據OECD(經濟合作與發展組織)統計,2022—2023年,美、中AI風投項目數量的全球份額分別保持在30%和20%,金額占比則分別保持在50%和20%左右,這與兩國經濟體量相對值有較大差別。考慮到逆全球化趨勢加劇,美國限制本土私募基金和風險資金對關鍵領域的海外科技公司進行投資,可能進一步拉開各國在AI研發方面獲得金融支持的差距。我們認為,未來中國在金融方面支持科技的主要發力者可能轉向國內金融投資機構,所以我國直接融資體系亟待完善。

從應用端來看,中國的AI暴露規模居于世界首位,在具身智能的應用領域具有尤為廣闊的市場,且行業擴散程度更為均勻,可能帶來更顯著的外部規模經濟效應。我們估計,2023年中國按購買力平價計算的AI暴露規模約為16.5萬億美元,處在第二位的美國約為11.6萬億美元,其中,兩國的數字智能暴露規模均約為5萬億美元,主要差距體現在中國的具身智能暴露規模明顯大于美國(見圖1.10b)。從結構上看,中國產值更多地分布在具身智能暴露程度較高的那些行業,包括農林牧漁、交通運輸、采礦、建筑和制造業等,而美國產值則更多地分布在數字智能暴露程度較高的房地產、科學研究與技術服務、信息傳輸、計算機服務等行業。基于各國AI暴露產值中各行業份額方差,中國的行業擴散程度相對更均勻,有助于放大外部規模經濟效應,促進協同轉型和基礎設施共享。政策環境與AI應用的關系較為復雜,出于隱私和人權等考慮對AI進行嚴格監管有助于防范潛在風險,也可能限制應用落地。中、美、日及歐洲等地目前都充分重視且提出了人工智能發展戰略,并積極關注數據保護。同時,不同地區因為文化價值觀和社會經濟需求的差異,對AI的監管程度也有差異。如歐盟通過《人工智能法案》,在監管質量和可靠性方面獲得進展,但對AI訓練數據透明度等方面的要求也引發了企業對因泄露商業機密而影響市場競爭的擔憂,[93]美國相對注重國家安全和倫理問題,而中國對AI技術持相對開放的態度,或有助于推動應用快速落地。

圖1.10 中國AI在研發端和應用端與他國對比

注:a.各分項為各國相對于美國的水平(美國=1);b.AI暴露規模由各行業的AI暴露程度與各行業產值占比加權求和,再乘以該國2023年按購買力平價計算的GDP獲得,行業的AI暴露程度參考本書第三章“元任務”相關內容。

資料來源:iFinD,OECD,中金研究院。

割裂的全球市場可能會阻礙AI的價值實現并抑制創新,這或許會促使部分地區在未來的智能融合浪潮中深化合作。基于現實經濟開放的視角,當前美國正在積極與歐洲和日本等地開展人工智能的廣泛合作,包括晶圓廠和數據中心的跨國布局、AI學術研究的合作交流、AI初創企業的跨國投資等。這些舉措可能加速第二梯隊的國家對中國的技術追趕,從AI發展指數看,表現為美國的合作國在研發端快速逼近最前沿水平。以日本為例,如果美國在未來將新研制的高性能和先進超算供給日本使用,派遣頂尖人才指導,向日本傳授AI技術,并共享已有的高質量和多模態數據、數據收集和合成的方法等,那么日本在AI發展指數上或將快速縮小與中國的差距。此時,中國經濟的規模優勢變得至關重要,它能夠幫助中國在AI研發相對落后的情況下,依靠應用端的市場擴散維持一定的競爭力。

五、思考與啟示

(一)通用模型或將帶來AI認知真實世界規律的突破

本輪AI發展最重要的意義在于,以Transformer為代表的深度學習算法的成功,標志著AI在通用模型層面取得了重要進展,這讓AI理解真實世界規律的能力獲得了里程碑式的突破。人工智能是模擬智能的系統,而智能是對世界真理的總結和認知能力,人類智能通過處理世界上不同維度的、各種類型的信息去反推真理。出現通用模型前,AI無法對各種類型的信息進行通用處理,總結規律的視角不全面,從而無法深入認識世界,影響自身性能提高,模擬更高水平的智能需要通用模型。Transformer出現之初并非所謂的通用模型,但由于各種類型的數據都可以看作序列并用Transformer處理,所以其在更高維度上建構了多類型數據所蘊含的規律空間,并對這些規律進行總結,從而將各種類型的智能模擬統一在一個架構中,因此,其被“意外”地發現了通用性潛力。從這一角度出發,通用模型對AI發展具有重要意義。Transformer打開了AI通往通用模型時代的大門,但最終的答案也未必一定是Transformer,更優秀的通用算法架構將為AI發展帶來助力。在通用模型中,AI對各類型數據信息進行通用處理,對各領域總結出來的規律進行遷移、交叉運用,更全面地刻畫現實世界中的規律,對世界真理的認識或將逐漸逼近真實情況。同時,AI對真實世界的理解離不開真實世界信息的輸入,這也為未來AI的數據和算力建設指明了方向,直接采集于真實世界的多模態數據建設方興未艾,其與人形機器人、高精度傳感器等的結合也將成為AI領域重點攻關方向,數據的豐富以及規模定律也都意味著更大的、性能更高的算力資源需求。

(二)智能成本下降將結構性沖擊勞動力市場,教育培訓和勞動保障是關鍵

智能成本作為AI新變革的核心,其快速下降可能引發AI和人類勞動者的再分工,進而對勞動力技能需求產生影響,在技術轉型的過程中需要關注技術進步對勞動者的沖擊。AI對勞動力市場的影響主要表現在兩個方面。一是對于AI應用成本高于人類或表現不及人類的智能任務,其對應的人類勞動需求將相對提升。如近年來AI高暴露的崗位對具有社交(溝通、團隊合作、談判、演講)和管理(員工監督、指導、領導)等AI互補型技能的人才需求逐步提高,而對提供基礎電腦(包括編程)和行政文書等相關技能的人才需求有所下降。[94]二是隨著AI應用的普及,市場對與開發維護AI系統、使用AI應用程序相關的人才的需求也將進一步提高。忽視技能轉型要求,可能加劇技能不匹配導致的就業不充分,以及關鍵人才緊缺導致的各行業發展速度放緩。為此,公共政策可以在培訓教育和勞動保障方面發揮重要作用。教育培訓方面,容易被AI取代的勞動力是公共政策提供教育培訓的重點對象,我國可以參考美歐通過牽頭企業、社區與教育機構共同開發符合崗位需求的AI及其互補技能培訓并建立認證計劃,來加速人才技能轉型;對于AI開發和應用等較難通過雇主培訓獲得的技能,政府可考慮向職業學校等專業機構撥款,以設置AI課程、雇用教師并為接受AI方面教育的學生提供補貼等。勞動保障方面,AI發展速度可能快于人類技能調整速度,進而引發結構性失業,對此勞動力保障政策應朝著鼓勵人才流動和靈活就業的方向調整,如延長給付失業救濟金的時間以支持失業人員完成AI技術及相關技能的學習,為因AI失業的勞動者提供經濟和求職援助,減少就業的異地限制,等等。

(三)政策端著力構建良好的公私合作框架,打通AI“研發—應用”循環互促渠道

AI技術具有明確的非連續性創新特征,所謂非連續性技術創新是指采用與主流技術截然不同的技術路線,旨在實現產品性能的數量級改進或成本的數量級降低,其具有強顛覆性和弱預見性兩個特征。強顛覆性意味著,該技術發展可以快速削弱傳統國家或企業長期積累的技術優勢,改變市場主體的力量對比;弱預見性是指技術路徑具有不確定性,人們難以事先精準預測最終將成功的技術路徑。兩個特征均導致發展非連續性技術創新是各國擺脫發展限制的客觀需要和占優策略。[95]AI正是具備強顛覆性與弱預見性的非連續性創新技術。在這一前提下,一方面,初級創新的領先者地位隨時有可能由于新技術路徑的突破而發生動搖,因此,即使當前追趕面臨挑戰,有機會跟隨前沿的大國仍不可松懈對研發端的持續投入和大力支持;另一方面,為相對降低AI技術弱預見性帶來的不確定性,有條件的大國若在技術相對成熟的應用端廣泛探索、提前布局將有可能實現后發先至。而要實現研發和應用兩方面的互促共進,離不開政策端發力,構建良好的公私合作框架,激發公私研究機構和企業的創新活力,為技術成果的應用和推廣提供支持,從而打通初級創新與次級創新相互迭代的進路。值得參考的是,2023年美國國家科學基金會與其他聯邦機構和高等學校合作,宣布成立7個新的AI研究所并提供戰略性聯邦投資,推動AI在科學和工業界的應用加速。[96]另外,還可借鑒歐盟《人工智能白皮書》中提出的構建“生態系統”的思路,適當增加對AI研發的公共投資,成立“AI研發公私網絡”,[97]促進學術界和產業界緊密融合,吸引更多私營部門參與,鼓勵初創公司在相對有保障的環境中測試新技術、新產品,并提供后續市場接口,促進其商業化。

(四)“研發弱,應用優”,需要放大市場需求對技術供給的反饋促進作用

根據AI發展指數,我國研發相對落后、應用較為領先的格局表明,撬動市場需求對技術供給的反饋促進作用可能成為我國研發追趕的重要發力方向。算力方面,AI研發需要平衡用戶使用感受的改善和模型智能水平的突破,應用端的用戶規模、使用習慣和智能需求等能夠指導研發端算力性能和規模的部署。對于不同類型的算力要求,通過建設算力基礎設施加強算力資源的統籌規劃和調度,同時鼓勵相關企業和科研機構協同開展算力芯片、架構、系統等關鍵技術的攻關。算法方面,協調AI開發者社區定期舉辦各類場景的創新大賽,鼓勵AI解決方案提供商積極對接企業需求與技術供給,從而幫助研究和開發人員積累實戰經驗,并基于現實用例不斷探索算法優化的可能。數據方面,為應用場景相關或用戶畫像相似的企業搭建公共數據平臺,借助匿名或加密技術,在安全合規的前提下,推動生產和使用過程中的數據及其處理技術的共享。這將通過流程標準化和規模效應降低獲取、清洗和分析數據的成本,幫助解決研發端數據規模不足、可得性差的問題,還可能利用數據之間的潛在關聯進一步優化模型表現。金融方面,通過研發費用的稅收減免等方式鼓勵企業將AI產品盈利投入研發環節,強化應用到研發的反哺機制;同時,為AI應用企業、研發機構和投資機構提供交流平臺,拓寬創新主體之間的對接渠道。


[1]本章作者:周子彭、李娜、陸趣、劉夢玲。

[2]Mayor A.Gods and Robots:Myths,Machines,and Ancient Dreams of Technology.Princeton University Press, 2019.

[3]Bishop C M.Pattern Recognition and Machine Learning.Springer,2006.

[4]LeCun Y,Bengio Y,Hinton G.“Deep Learning.”Nature,2015,521(7553).

[5]Legg S,Hutter M.“Universal Intelligence:A Definition of Machine Intelligence.”Minds and Machines, 2007, 17.

[6]Leningrad (RSFSR), Shirokov M, Moseley A C, et al.A Textbook of Marxist Philosophy. Gollancz, 1937.

[7]Plato P.The Republic.Oxford University Press,2008.

[8]Gardner H.Multiple Intelligences:The Theory in Practice.Basic Books/Hachette Book Group,1993.

[9]Stemberg R J.“Intelligence.State of the Art.”Dialogues in Clinical Neuroscience,2012,14(1).

[10]參見https://lexfridman.com/yann-lecun-3-transcript/。

[11]Chollet F.“On the Measure of Intelligence.”2019.

[12]Aquinas S T.“Summa Theologica.”1872.

[13]Christodoulou K C, Tsoucalas G.“Artificial Intelligence: From Talos to da Vinci.”2023.

[14]Descartes R.“Descartes: Discourse on the Method of Rightly Conducting the Reason, and Seeking Truth in the Sciences.”1658.

[15]Chomsky N.Language and Mind.Cambridge University Press,2006.

[16]Cajal S R.“Conexión General de los Elementos Nerviosos.”1889.

[17]Kandel E R.In Search of Memory:The Emergence of a New Science of Mind.W.W.Norton&Company, 2006.

[18]Cajal.“Conexión General de los Elementos Nerviosos.”1889.

[19]McCulloch W S,Pitts W.“A Logical Calculus of the Ideas Immanent in Nervous Activity.”The Bulletin of Mathematical Biophysics,1943.

[20]Rosenblatt F.“The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.”Psychological Review,1958,65(6).

[21]Minsky M L,Papert S A.Perceptrons:Expanded Edition.MIT Press,1988.

[22]Newell A.Unified Theories of Cognition.Harvard University Press,1990.

[23]Feigenbaum E A, Buchanan B G.“DENDRAL and META-DENDRAL: Roots of Knowledge Systems and Expert System Applications.”1994.

[24]Sipser M.“Introduction to the Theory of Computation.”ACM Sigact News,1996.

[25]Catania B,Zarri G P.Intelligent Database Systems.Addison-Wesley,2000.

[26]Fisher I A.“Cyc:History’s Forgotten AI Project.”Outsider Art,2024.

[27]Hopfield J J.“Neural Networks and Physical Systems with Emergent Collective Computational Abilities.”Proceedings of the National Academy of Sciences,1982,79(8).

[28]Rumelhart D E, Hinton G E, Williams R J.“Learning Representations by Back-Propagating Errors.”Nature,1986,323(6088).

[29]LeCun Y, Boser B, Denker J S, et al.“Backpropagation Applied to Handwritten Zip Code Recognition.”Neural Computation,1989,1(4).

[30]Hinton G E, Osindero S, Teh Y W.“A Fast Learning Algorithm for Deep Belief Nets.”Neural Computation,2006,18(7).

[31]Krizhevsky A, Sutskever I, Hinton G E.“Imagenet Classification with Deep Convolutional Neural Networks.”Advances in Neural Information Processing Systems,2012.

[32]Vaswani A,Shazeer N, Parmar N, et al.“Attention Is All You Need.”Advances in Neural Information Processing Systems,2017,30.

[33]Gupta A, Fan L, Ganguli S, et al.“Metamorph: Learning Universal Controllers with Transformers.”2022.

[34]Gao J, Cheng N, Fang B, et al.“Transformer in Touch: A Survey.”2024.

[35]Charoenkwan P, Nantasenamat C, Hasan M M, et al.“BERT4Bitter: A Bidirectional Encoder Representa-tions from Transformers (BERT)-Based Model for Improving the Prediction of Bitter Peptides.”Bioinformatics,2021,37(17).

[36]Trinh T H,Wu Y,Le Q V,et al.“Solving Olympiad Geometry Without Human Demonstrations.”Nature, 2024, 625(7995).

[37]數字智能指以虛擬智能助理形式存在的AI,可能仍以移動終端、互聯網為載體,通過AI大模型對用戶輸入的文本、圖像、視頻、語音等信息進行處理,理解用戶指令和需求,進行推理、規劃等,內置長短期記憶功能,長期記憶部分依靠外掛知識庫和增強檢索引擎,并能根據任務要求和解決方案來發布指令或調用工具。

[38]具身智能主要指智能和物理實體的結合,如人形機器人和機器狗可以將感知、決策和執行加以統一,通過傳感裝置感知和收集各種類型的環境信息。

[39]參見https://app.youtubesummarized.com/r/3FxxT-sDnfk9zVtC5LOW-。

[40]Huh M, Cheung B, Wang T, et al.“The Platonic Representation Hypothesis.”2024.

[41]Sutton R.“The Bitter Lesson.”Incomplete Ideas (blog), 2019.

[42]參見https://www.nvidia.com/en-gb/about-nvidia/ai-computing/。

[43]Kaplan J, McCandlish S, Henighan T, et al.“Scaling Laws for Neural Language Models.”2020.

[44]Henighan T, Kaplan J, Katz M, et al.“Scaling Laws for Autoregressive Generative Modeling.”2020.

[45]Isik B, Ponomareva N, Hazimeh H, et al.“Scaling Laws for Downstream Task Performance of Large Language Models.”2024.

[46]Wei J, Tay Y, Bommasani R, et al.“Emergent Abilities of Large Language Models.”2022.

[47]Schaeffer R, Miranda B, Koyejo S.“Are Emergent Abilities of Large Language Models a Mirage?”2023.

[48]Villalobos P, Sevilla J, Heim L, et al.“Will We Run out of Data? An Analysis of the Limits of Scaling Datasets in Machine Learning.”2022.

[49]Chomsky N,Roberts L,Watmull J.“The False Promise of ChatGPT.”The New York Times,2023.

[50]Marcus G.“The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence.”2020.

[51]Bekar C, Carlaw K, Lipsey R.“General Purpose Technologies in Theory, Application and Controversy:A Review.”Journal of Evolutionary Economics,2018,28.

[52]Korinek A, Suh D.“Scenarios for the Transition to Agi.”NBER Working Paper, 2024; IMF.“Gen-AI:Artificial Intelligence and the Future of Work.”2024.

[53]Araby.“AI, The Future Is Now: A Deep Dive into AI Adoption Across Industries.”2023; Araby.“S&P Global Market Intelligence, Risks, Regulation in Focus as AI Boom Accelerates.”2023.

[54]參見https://cloud.baidu.com/news/news_c5655de1-51e7-40e1-8811-a4e65ac6e387。

[55]Jovanovic B,Rousseau P L.“General Purpose Technologies.”Handbook of Economic Growth,2005.

[56]Pyzer-Knapp E O, Pitera J W, Staar P W J, et al.“Accelerating Materials Discovery Using Artificial Intelligence,High Performance Computing and Robotics.”npj Computational Materials,2022,8(1).

[57]“How Scientists Are Using Artificial Intelligence.”The Economist,2023.

[58]參見https://www.vellum.ai/blog/claude-3-opus-vs-gpt4-task-specific-analysis。

[59]參見https://www.vellum.ai/blog/analysis-gpt-4o-vs-gpt-4-turbo。

[60]參見https://explodingtopics.com/blog/chatgpt-users。

[61]參見https://www.reuters.com/technology/openai-hits-2-bln-revenue-milestone-ft-2024-02-09/。

[62]參見https://blogs.microsoft.com/blog/2024/05/20/introducing-copilot-pcs/。

[63]參見https://www.idc.com/getdoc.jsp?containerId=prUS51851424。

[64]Stanford.“Artificial Intelligence Index Report 2024.”2024.

[65]參見https://windowsontheory.org/2023/07/17/the-shape-of-agi-cartoons-and-back-of-envelope/。

[66]Jovanovic B,Rousseau P L.“General Purpose Technologies.”Handbook of Economic Growth,2005.

[67]參見https://wallstreetcn.com/articles/3710044。

[68]Thompson N, Fleming.“A Model for Estimating the Economic Costs of Computer Vision Systems That Use Deep Learning.”Proceedings of the AAAI Conference on Artificial Intelligence, 2024.

[69]參見本書第二章相關內容。

[70]Pilz K, Heim L, Brown N.“Increased Compute Efficiency and the Diffusion of AI Capabilities.”2024.

[71]參見https://newsletter.victordibia.com/p/top-5-ai-announcements-and-implications。

[72]Sachs G.“The Global Market for Humanoid Robots Could Reach $38 Billion by 2035.”2024.

[73]參見https://electrek.co/2024/03/27/elon-musk-tesla-optimus-robot-cost-less-than-half-car/。

[74]參見https://stanfordmag.org/contents/me-myself-and-ai。

[75]參見https://www.marketingaiinstitute.com/blog/sam-altman-atlantic。

[76]張小雪:《數字人的角色沖突與倫理風險》,《青年記者》,2023年第14期。

[77]World Bank Group.“Innovative China: New Drivers of Growth.”2019.

[78]此處的“理論知識”,即science、technology、innovation,簡稱STI,“‘工匠’知識”或“實踐知識”為doing、using、interacting, 簡稱DUI,參見:Binz, et al.“Catch-up Dynamics in Early Industry.”2020。

[79]Romer P M.“Increasing Returns and Long-Run Growth.”Journal of Political Economy,1986,94(5).

[80]Rosiello A, Maleki A.“A dynamic Multi-Sector Analysis of Technological Catch-up: The Impact of Technology Cycle Times,Knowledge Base Complexity and Variety.”Research Policy,2021.

[81]Gunasekar S, Zhang Y, Aneja J, et al.“Textbooks Are All You Need.”2023.

[82]Koch B, Denton E, Hanna A, et al.“Reduced, Reused and Recycled: The Life of a Dataset in Machine Learning Research.”2021.

[83]陸趣、黎芝源、周子彭:《競爭人工智能 從論文突破性看中國人工智能創新水平機制》,中金研究院,2023年。

[84]參見https://macropolo.org/digital-projects/the-global-ai-talent-tracker/。

[85]Xu L, Xiong J, Yan J, et al.“Technological Uncertainty and Catch-Up Patterns: Insights of Four Chinese Manufacturing Sectors.”IEEE Transactions on Engineering Management,2023.

[86]參見https://artificialintelligenceact.eu/。

[87]參見https://arxiv.org/abs/2202.05924。

[88]OECD.“A Blueprint for Building National Compute Capacity for Artificial Intelligence.”2023.

[89]參見本書第十二章相關內容。

[90]“政策環境”指標采用牛津大學的AI治理指數,包括AI戰略、監管質量、網絡安全、倫理準則和可靠性五個維度的分數。

[91]參考華為昇騰910B芯片與英偉達專門針對中國、符合美國出口限制條款芯片的比較參數。

[92]Tortoise Media.“The Global Artificial Intelligence Index.”2023.

[93]參見https://www.reuters.com/technology/artificial-intelligence/eus-new-ai-rules-ignite-battle-over-data-transparency-2024-06-13/。

[94]Green A.“Artificial Intelligence and the Changing Demand for Skills in the Labour Market.”OECD, 2024.

[95]中金研究院:《科技創新的競爭與理論》,2023年。

[96]參見https://new.nsf.gov/news/nsf-announces-7-new-national-artificial。

[97]參見https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:52020DC0065。

主站蜘蛛池模板: 多伦县| 黄平县| 合江县| 肥东县| 乌什县| 三明市| 龙南县| 会同县| 廊坊市| 宿州市| 永川市| 龙里县| 宁晋县| 佛教| 枣强县| 青冈县| 绥江县| 台南市| 长春市| 海林市| 九台市| 突泉县| 诸暨市| 永嘉县| 三门县| 焉耆| 古浪县| 庆安县| 科尔| 阳东县| 上栗县| 伊川县| 花莲县| 江西省| 图片| 色达县| 静安区| 纳雍县| 开鲁县| 民县| 专栏|