- 超級助理:AI時代的工作方式
- 秦朔主編
- 14字
- 2024-07-02 16:21:00
上部 從信息化到數智化
第一章 人工智能:從玩具到工具
人工智能發展的第四階段
2022年9月,全球風險投資機構對生成式人工智能進行大規模投資的前夕,紅杉資本發表了一篇預測性文章《生成式人工智能:創意新世界》(Generative AI: A Creative New World),提出“預計AI的殺手級應用即將出現,比賽開始了”的判斷。
所謂“生成式人工智能”是指:機器比人類在分析方面做得更好,機器分析被稱為“分析人工智能”或傳統人工智能,但人類不僅擅長分析,還擅長創造,現在,機器剛剛開始擅長創造有意義和美麗的東西,這一新類別被稱為“生成式人工智能”。也就是說,現在機器不僅能夠分析已經存在的東西,還開始創造全新的東西。
按照紅杉資本的梳理,人工智能發展歷程目前可以分為四個階段,而我們現在正在進入第四個階段。
● 階段一:小模型至上(2015年之前):將近10年前,小模型被認為是理解語言的“最先進技術”。小模型擅長分析任務,并可以用于從預測交貨時間到欺詐分類等工作。然而,小模型對于通用生成任務的表達能力不夠,生成人類水平的寫作或代碼仍然只是一個夢想。
● 階段二:規模競賽(從2015年開始):谷歌研究院的一篇里程碑式論文《注意力是你所需的一切》(Attention Is All You Need)描述了一種用于自然語言理解的新型神經網絡架構,這種架構被稱作transformers。它可以生成高質量的語言模型,同時可并行性更強,訓練所需的時間也大大減少。這些模型是小樣本學習器,可以相對容易地根據特定領域進行定制。
而隨著模型越來越大,其表現開始與人類水平相當,然后是超人類水平的結果。從2015年到2020年,用于訓練這些模型的計算量增加了6個數量級,其結果超過了人類在手寫、語音和圖像識別、閱讀理解以及語言理解方面的性能基準。其中,OpenAI的GPT-3脫穎而出,該模型的性能比GPT-2有了巨大的飛躍。
盡管基礎研究取得了很大進展,但這些模型并沒有得到普及。它們體積龐大,難以運行(需要圖形處理器協調),不能廣泛訪問(不可用或僅為封閉測試版),而且作為云服務使用成本高昂。盡管存在這些限制,但是最早的生成式人工智能應用已經開始進入戰場。
● 階段三:更好、更快、更便宜(從2022年開始):計算變得越來越便宜,如擴散模型(diffusion models)等新技術降低了訓練與運行推理所需要的成本。研究界不斷開發出更好的算法和更大的模型。開發人員的訪問權限從封閉測試版擴展到了公開測試版,或者在某些情況下是開源的。
對于那些一直無法訪問LLM(大語言模型)的開發人員來說,探索和應用開發的大門現在已經打開,應用開始綻放。
● 階段四:殺手級應用出現(現在):隨著平臺層的穩固,模型不斷變得更好、更快、更便宜,以及模型訪問趨向于免費和開源,應用層的創造力爆發時機已經成熟。
我們期待這些大型模型能推動新一輪的生成式人工智能應用,正如移動設備通過GPS(全球定位系統)、攝像頭和隨身連接等新功能釋放出新應用一樣。紅杉資本預測:正如十年前移動技術的拐點為少數殺手級應用開辟了市場,預計生成式人工智能也將出現殺手級應用。比賽已經開始。
而促使紅杉資本發表這一預測的直接原因是:2022年4月,一家位于硅谷的人工智能初創公司突然點亮了整個美國創投界,它就是此后照亮了全世界的OpenAI。
2015年,非營利組織OpenAI由特斯拉的創始人埃隆·馬斯克和硅谷著名孵化器YC的前總裁薩姆·奧爾特曼等人共同出資10億美元創建。
后來,奧爾特曼在接受《紐約客》采訪時曾經提及為什么他要去幫馬斯克創建OpenAI。大概意思如下。
28歲這一年,奧爾特曼突然意識到:人類不是獨一無二的。很快,計算機就能夠復制他們的大腦。在某些方面,人類可能還具有特殊性,比如創造力、靈感、感受情緒的能力,但是很快計算機也會有自己的欲望和人生目標。
奧爾特曼說:“當得知智能可以被模擬時,我就不再認為人類有什么獨特性了。而且相比于人類,機器還有很多優勢——人類在輸入和輸出方面太慢,每秒只能學習兩個bit數據,但是對于計算機,這簡直就是慢動作。”
2003年,瑞典哲學家尼克·博斯特羅姆曾經提出一個著名的假設:如果我們對一個全能的人工智能下命令,要求它制作盡可能多的回形針。那么,在沒有其他指令的情況下,它就會耗盡地球上所有資源來制造回形針——包括你、我身體里的原子。
也就是說,人工智能將變得無比強大,但是它沒有人類的價值觀。于是,為了幫助全人類做戰略防御,奧爾特曼決定與馬斯克一起創立OpenAI。
他們模擬的敵人,就是谷歌旗下的DeepMind。因為如果世界上只有一個DeepMind,那么假設有一天DeepMind出了問題,也許就會出現一個不朽的超級獨裁者。這個獨裁者會殺光所有競爭對手的研究人員,就像修改一個程序的bug(漏洞)一樣。
而OpenAI的第一個任務,就是要從谷歌和臉書等美國科技巨頭手中奪取人工智能的人才。
不過,OpenAI也有自己的問題。因為它的出發點是完全“防御性”和“利他性”的,所以沒有人知道它想要什么——它的欲望是什么呢?(尤其是在威脅還沒有發生時。)這就像一個創業者昭告天下他要創業了,但是他的行為方式卻像在“帶發修行”一樣。
OpenAI募集了10億美元資金,雇用了一支由30名研究人員組成的超級強大的團隊。他們想干什么呢?
馬斯克后來幫助OpenAI提出了一個策略:最好的防御方式,就是讓盡可能多的人擁有人工智能。因為如果世界上每一個人都有人工智能的能力,那么就沒有任何一個人或者一小部分人可以擁有人工智能的超能力。
這也奠定了之后OpenAI商業模式的基礎,那就是:向全世界出售自己的AI產品許可。
2022年4月,OpenAI向公眾發布了自己開發的機器學習模型DALL·E2,專門用于從自然語言描述中生成數字圖像;同年7月,OpenAI開始出售DALL·E2圖像生成軟件的許可。很快,DALL·E2就正式開啟了硅谷社交媒體上的一場AI生成藝術盛宴。
不過,讓OpenAI始料未及的是:從2022年7月開始,整個硅谷和歐洲都出現了幾家被全球科技界瘋狂關注的生成式人工智能初創公司。其中,Midjourney公司的產品是一款精美的藝術生成器。它沒有網站,功能全集成在Discord(專為社群設計的免費網絡實時通話軟件與數字發行平臺)的一個頻道里,并且很快就積累了約300萬用戶。人們使用這款軟件,可以在幾秒鐘之內就生成精美而富有詩意的圖片。例如,當你輸入提示詞“rain and yellow light”(雨和黃色的燈光)時,Midjourney能夠在幾秒鐘內生成一張“一個撐著傘在檸檬黃的夜燈下孤獨行走的人的背影”的圖片。
戴維·霍爾茨是Midjourney的創始人。他這樣形容自己對生成式人工智能的理解:
“我們不認為這真的是關于藝術或者制作深度偽造品,而是關于——我們如何擴展人類的想象力。因為當計算機的視覺想象力比99%的人類更好時,這意味著什么呢?這不意味著我們將停止想象。汽車比人類行走的速度快,但這不意味著我們停止了步行。當我們要把大量的東西移動很遠的距離時,我們需要飛機、輪船或汽車。因此,我們將這項技術視為——‘想象力的引擎’。”
開源人工智能軟件也在這個時候興起——Stable Diffusion的突然出現,讓整個人工智能世界都大吃一驚。通過使用Stable Diffusion,包括Stability AI和后來大名鼎鼎的Runway在內的人工智能初創公司,已經為它們的客戶開發了內容創建工具。
到了這個時候,全球創投界已經涌現出了大量狂熱的技術,生成式人工智能初創公司獲得融資的消息,也頻頻出現在美國媒體和各大科技網站上。與此同時,美國創投界的思想家們紛紛發表自己的看法。其中,薩姆·奧爾特曼的兩段話廣為傳播:
“生成式人工智能提醒我們,人們很難做出有關人工智能的預測。十年前,傳統觀點認為:人工智能首先會影響體力勞動,然后影響認知勞動,最后,也許有一天它可以做創造性工作。現在看起來,它會以相反的順序進行。”
一時之間,有關生成式人工智能的創造競賽,以小時為單位在全球范圍內展開。但僅僅是在幾個月前,硅谷還籠罩在一片烏云之中。
2022年第一季度,全球風險投資活動出現回調,全球風險投資總額為1600億美元,這是12個月以來的第一次下降。這種回調,當然與美股二級市場的“崩潰”有關。事后的一系列數據表明:此后,全球風險投資將快速地,甚至也許是殘酷地,從一個超級泡沫化、繁榮的環境,過渡到一個許多交易都沒有完成的環境。
但是有關生成式人工智能的投資,卻很快又“咆哮著”回來了。
這種從黑暗的蕭條、跌宕起伏到興奮的轉折能力,也許正是硅谷創業界創造未來的核心力量。風險投資界已經躍躍欲試。
正如紅杉資本在《生成式人工智能:創意新世界》一文中所說:“生成式人工智能還處于很早期。平臺層剛剛好,而應用空間幾乎還沒出現。但預計AI的殺手級應用即將出現,比賽開始了。”