書名：超級(jí)助理：AI時(shí)代的工作方式
作者名：秦朔主編
本章字?jǐn)?shù)： 14字
更新時(shí)間： 2024-07-02 16:21:00

上部　從信息化到數(shù)智化

第一章　人工智能：從玩具到工具

人工智能發(fā)展的第四階段

2022年9月，全球風(fēng)險(xiǎn)投資機(jī)構(gòu)對(duì)生成式人工智能進(jìn)行大規(guī)模投資的前夕，紅杉資本發(fā)表了一篇預(yù)測(cè)性文章《生成式人工智能：創(chuàng)意新世界》（Generative AI: A Creative New World），提出“預(yù)計(jì)AI的殺手級(jí)應(yīng)用即將出現(xiàn)，比賽開始了”的判斷。

所謂“生成式人工智能”是指：機(jī)器比人類在分析方面做得更好，機(jī)器分析被稱為“分析人工智能”或傳統(tǒng)人工智能，但人類不僅擅長分析，還擅長創(chuàng)造，現(xiàn)在，機(jī)器剛剛開始擅長創(chuàng)造有意義和美麗的東西，這一新類別被稱為“生成式人工智能”。也就是說，現(xiàn)在機(jī)器不僅能夠分析已經(jīng)存在的東西，還開始創(chuàng)造全新的東西。

按照紅杉資本的梳理，人工智能發(fā)展歷程目前可以分為四個(gè)階段，而我們現(xiàn)在正在進(jìn)入第四個(gè)階段。

● 階段一：小模型至上（2015年之前）：將近10年前，小模型被認(rèn)為是理解語言的“最先進(jìn)技術(shù)”。小模型擅長分析任務(wù)，并可以用于從預(yù)測(cè)交貨時(shí)間到欺詐分類等工作。然而，小模型對(duì)于通用生成任務(wù)的表達(dá)能力不夠，生成人類水平的寫作或代碼仍然只是一個(gè)夢(mèng)想。

● 階段二：規(guī)模競(jìng)賽（從2015年開始）：谷歌研究院的一篇里程碑式論文《注意力是你所需的一切》（Attention Is All You Need）描述了一種用于自然語言理解的新型神經(jīng)網(wǎng)絡(luò)架構(gòu)，這種架構(gòu)被稱作transformers。它可以生成高質(zhì)量的語言模型，同時(shí)可并行性更強(qiáng)，訓(xùn)練所需的時(shí)間也大大減少。這些模型是小樣本學(xué)習(xí)器，可以相對(duì)容易地根據(jù)特定領(lǐng)域進(jìn)行定制。

而隨著模型越來越大，其表現(xiàn)開始與人類水平相當(dāng)，然后是超人類水平的結(jié)果。從2015年到2020年，用于訓(xùn)練這些模型的計(jì)算量增加了6個(gè)數(shù)量級(jí)，其結(jié)果超過了人類在手寫、語音和圖像識(shí)別、閱讀理解以及語言理解方面的性能基準(zhǔn)。其中，OpenAI的GPT-3脫穎而出，該模型的性能比GPT-2有了巨大的飛躍。

盡管基礎(chǔ)研究取得了很大進(jìn)展，但這些模型并沒有得到普及。它們體積龐大，難以運(yùn)行（需要圖形處理器協(xié)調(diào)），不能廣泛訪問（不可用或僅為封閉測(cè)試版），而且作為云服務(wù)使用成本高昂。盡管存在這些限制，但是最早的生成式人工智能應(yīng)用已經(jīng)開始進(jìn)入戰(zhàn)場(chǎng)。

● 階段三：更好、更快、更便宜（從2022年開始）：計(jì)算變得越來越便宜，如擴(kuò)散模型（diffusion models）等新技術(shù)降低了訓(xùn)練與運(yùn)行推理所需要的成本。研究界不斷開發(fā)出更好的算法和更大的模型。開發(fā)人員的訪問權(quán)限從封閉測(cè)試版擴(kuò)展到了公開測(cè)試版，或者在某些情況下是開源的。

對(duì)于那些一直無法訪問LLM（大語言模型）的開發(fā)人員來說，探索和應(yīng)用開發(fā)的大門現(xiàn)在已經(jīng)打開，應(yīng)用開始綻放。

● 階段四：殺手級(jí)應(yīng)用出現(xiàn)（現(xiàn)在）：隨著平臺(tái)層的穩(wěn)固，模型不斷變得更好、更快、更便宜，以及模型訪問趨向于免費(fèi)和開源，應(yīng)用層的創(chuàng)造力爆發(fā)時(shí)機(jī)已經(jīng)成熟。

我們期待這些大型模型能推動(dòng)新一輪的生成式人工智能應(yīng)用，正如移動(dòng)設(shè)備通過GPS（全球定位系統(tǒng)）、攝像頭和隨身連接等新功能釋放出新應(yīng)用一樣。紅杉資本預(yù)測(cè)：正如十年前移動(dòng)技術(shù)的拐點(diǎn)為少數(shù)殺手級(jí)應(yīng)用開辟了市場(chǎng)，預(yù)計(jì)生成式人工智能也將出現(xiàn)殺手級(jí)應(yīng)用。比賽已經(jīng)開始。

而促使紅杉資本發(fā)表這一預(yù)測(cè)的直接原因是：2022年4月，一家位于硅谷的人工智能初創(chuàng)公司突然點(diǎn)亮了整個(gè)美國創(chuàng)投界，它就是此后照亮了全世界的OpenAI。

2015年，非營利組織OpenAI由特斯拉的創(chuàng)始人埃隆·馬斯克和硅谷著名孵化器YC的前總裁薩姆·奧爾特曼等人共同出資10億美元?jiǎng)?chuàng)建。

后來，奧爾特曼在接受《紐約客》采訪時(shí)曾經(jīng)提及為什么他要去幫馬斯克創(chuàng)建OpenAI。大概意思如下。

28歲這一年，奧爾特曼突然意識(shí)到：人類不是獨(dú)一無二的。很快，計(jì)算機(jī)就能夠復(fù)制他們的大腦。在某些方面，人類可能還具有特殊性，比如創(chuàng)造力、靈感、感受情緒的能力，但是很快計(jì)算機(jī)也會(huì)有自己的欲望和人生目標(biāo)。

奧爾特曼說：“當(dāng)?shù)弥悄芸梢员荒M時(shí)，我就不再認(rèn)為人類有什么獨(dú)特性了。而且相比于人類，機(jī)器還有很多優(yōu)勢(shì)——人類在輸入和輸出方面太慢，每秒只能學(xué)習(xí)兩個(gè)bit數(shù)據(jù)，但是對(duì)于計(jì)算機(jī)，這簡直就是慢動(dòng)作。”

2003年，瑞典哲學(xué)家尼克·博斯特羅姆曾經(jīng)提出一個(gè)著名的假設(shè)：如果我們對(duì)一個(gè)全能的人工智能下命令，要求它制作盡可能多的回形針。那么，在沒有其他指令的情況下，它就會(huì)耗盡地球上所有資源來制造回形針——包括你、我身體里的原子。

也就是說，人工智能將變得無比強(qiáng)大，但是它沒有人類的價(jià)值觀。于是，為了幫助全人類做戰(zhàn)略防御，奧爾特曼決定與馬斯克一起創(chuàng)立OpenAI。

他們模擬的敵人，就是谷歌旗下的DeepMind。因?yàn)槿绻澜缟现挥幸粋€(gè)DeepMind，那么假設(shè)有一天DeepMind出了問題，也許就會(huì)出現(xiàn)一個(gè)不朽的超級(jí)獨(dú)裁者。這個(gè)獨(dú)裁者會(huì)殺光所有競(jìng)爭對(duì)手的研究人員，就像修改一個(gè)程序的bug（漏洞）一樣。

而OpenAI的第一個(gè)任務(wù)，就是要從谷歌和臉書等美國科技巨頭手中奪取人工智能的人才。

不過，OpenAI也有自己的問題。因?yàn)樗某霭l(fā)點(diǎn)是完全“防御性”和“利他性”的，所以沒有人知道它想要什么——它的欲望是什么呢？（尤其是在威脅還沒有發(fā)生時(shí)。）這就像一個(gè)創(chuàng)業(yè)者昭告天下他要?jiǎng)?chuàng)業(yè)了，但是他的行為方式卻像在“帶發(fā)修行”一樣。

OpenAI募集了10億美元資金，雇用了一支由30名研究人員組成的超級(jí)強(qiáng)大的團(tuán)隊(duì)。他們想干什么呢？

馬斯克后來幫助OpenAI提出了一個(gè)策略：最好的防御方式，就是讓盡可能多的人擁有人工智能。因?yàn)槿绻澜缟厦恳粋€(gè)人都有人工智能的能力，那么就沒有任何一個(gè)人或者一小部分人可以擁有人工智能的超能力。

這也奠定了之后OpenAI商業(yè)模式的基礎(chǔ)，那就是：向全世界出售自己的AI產(chǎn)品許可。

2022年4月，OpenAI向公眾發(fā)布了自己開發(fā)的機(jī)器學(xué)習(xí)模型DALL·E2，專門用于從自然語言描述中生成數(shù)字圖像；同年7月，OpenAI開始出售DALL·E2圖像生成軟件的許可。很快，DALL·E2就正式開啟了硅谷社交媒體上的一場(chǎng)AI生成藝術(shù)盛宴。

不過，讓OpenAI始料未及的是：從2022年7月開始，整個(gè)硅谷和歐洲都出現(xiàn)了幾家被全球科技界瘋狂關(guān)注的生成式人工智能初創(chuàng)公司。其中，Midjourney公司的產(chǎn)品是一款精美的藝術(shù)生成器。它沒有網(wǎng)站，功能全集成在Discord（專為社群設(shè)計(jì)的免費(fèi)網(wǎng)絡(luò)實(shí)時(shí)通話軟件與數(shù)字發(fā)行平臺(tái)）的一個(gè)頻道里，并且很快就積累了約300萬用戶。人們使用這款軟件，可以在幾秒鐘之內(nèi)就生成精美而富有詩意的圖片。例如，當(dāng)你輸入提示詞“rain and yellow light”（雨和黃色的燈光）時(shí)，Midjourney能夠在幾秒鐘內(nèi)生成一張“一個(gè)撐著傘在檸檬黃的夜燈下孤獨(dú)行走的人的背影”的圖片。

戴維·霍爾茨是Midjourney的創(chuàng)始人。他這樣形容自己對(duì)生成式人工智能的理解：

“我們不認(rèn)為這真的是關(guān)于藝術(shù)或者制作深度偽造品，而是關(guān)于——我們?nèi)绾螖U(kuò)展人類的想象力。因?yàn)楫?dāng)計(jì)算機(jī)的視覺想象力比99%的人類更好時(shí)，這意味著什么呢？這不意味著我們將停止想象。汽車比人類行走的速度快，但這不意味著我們停止了步行。當(dāng)我們要把大量的東西移動(dòng)很遠(yuǎn)的距離時(shí)，我們需要飛機(jī)、輪船或汽車。因此，我們將這項(xiàng)技術(shù)視為——‘想象力的引擎’。”

開源人工智能軟件也在這個(gè)時(shí)候興起——Stable Diffusion的突然出現(xiàn)，讓整個(gè)人工智能世界都大吃一驚。通過使用Stable Diffusion，包括Stability AI和后來大名鼎鼎的Runway在內(nèi)的人工智能初創(chuàng)公司，已經(jīng)為它們的客戶開發(fā)了內(nèi)容創(chuàng)建工具。

到了這個(gè)時(shí)候，全球創(chuàng)投界已經(jīng)涌現(xiàn)出了大量狂熱的技術(shù)，生成式人工智能初創(chuàng)公司獲得融資的消息，也頻頻出現(xiàn)在美國媒體和各大科技網(wǎng)站上。與此同時(shí)，美國創(chuàng)投界的思想家們紛紛發(fā)表自己的看法。其中，薩姆·奧爾特曼的兩段話廣為傳播：

“生成式人工智能提醒我們，人們很難做出有關(guān)人工智能的預(yù)測(cè)。十年前，傳統(tǒng)觀點(diǎn)認(rèn)為：人工智能首先會(huì)影響體力勞動(dòng)，然后影響認(rèn)知?jiǎng)趧?dòng)，最后，也許有一天它可以做創(chuàng)造性工作?，F(xiàn)在看起來，它會(huì)以相反的順序進(jìn)行。”

一時(shí)之間，有關(guān)生成式人工智能的創(chuàng)造競(jìng)賽，以小時(shí)為單位在全球范圍內(nèi)展開。但僅僅是在幾個(gè)月前，硅谷還籠罩在一片烏云之中。

2022年第一季度，全球風(fēng)險(xiǎn)投資活動(dòng)出現(xiàn)回調(diào)，全球風(fēng)險(xiǎn)投資總額為1600億美元，這是12個(gè)月以來的第一次下降。這種回調(diào)，當(dāng)然與美股二級(jí)市場(chǎng)的“崩潰”有關(guān)。事后的一系列數(shù)據(jù)表明：此后，全球風(fēng)險(xiǎn)投資將快速地，甚至也許是殘酷地，從一個(gè)超級(jí)泡沫化、繁榮的環(huán)境，過渡到一個(gè)許多交易都沒有完成的環(huán)境。

但是有關(guān)生成式人工智能的投資，卻很快又“咆哮著”回來了。

這種從黑暗的蕭條、跌宕起伏到興奮的轉(zhuǎn)折能力，也許正是硅谷創(chuàng)業(yè)界創(chuàng)造未來的核心力量。風(fēng)險(xiǎn)投資界已經(jīng)躍躍欲試。

正如紅杉資本在《生成式人工智能：創(chuàng)意新世界》一文中所說：“生成式人工智能還處于很早期。平臺(tái)層剛剛好，而應(yīng)用空間幾乎還沒出現(xiàn)。但預(yù)計(jì)AI的殺手級(jí)應(yīng)用即將出現(xiàn)，比賽開始了。”

官术网_书友最值得收藏!

超級(jí)助理：AI時(shí)代的工作方式

上部 從信息化到數(shù)智化

第一章 人工智能：從玩具到工具

人工智能發(fā)展的第四階段

上部　從信息化到數(shù)智化

第一章　人工智能：從玩具到工具