官术网_书友最值得收藏!

上部 從信息化到數(shù)智化

第一章 人工智能:從玩具到工具

人工智能發(fā)展的第四階段

2022年9月,全球風(fēng)險(xiǎn)投資機(jī)構(gòu)對(duì)生成式人工智能進(jìn)行大規(guī)模投資的前夕,紅杉資本發(fā)表了一篇預(yù)測(cè)性文章《生成式人工智能:創(chuàng)意新世界》(Generative AI: A Creative New World),提出“預(yù)計(jì)AI的殺手級(jí)應(yīng)用即將出現(xiàn),比賽開始了”的判斷。

所謂“生成式人工智能”是指:機(jī)器比人類在分析方面做得更好,機(jī)器分析被稱為“分析人工智能”或傳統(tǒng)人工智能,但人類不僅擅長分析,還擅長創(chuàng)造,現(xiàn)在,機(jī)器剛剛開始擅長創(chuàng)造有意義和美麗的東西,這一新類別被稱為“生成式人工智能”。也就是說,現(xiàn)在機(jī)器不僅能夠分析已經(jīng)存在的東西,還開始創(chuàng)造全新的東西。

按照紅杉資本的梳理,人工智能發(fā)展歷程目前可以分為四個(gè)階段,而我們現(xiàn)在正在進(jìn)入第四個(gè)階段。

● 階段一:小模型至上(2015年之前):將近10年前,小模型被認(rèn)為是理解語言的“最先進(jìn)技術(shù)”。小模型擅長分析任務(wù),并可以用于從預(yù)測(cè)交貨時(shí)間到欺詐分類等工作。然而,小模型對(duì)于通用生成任務(wù)的表達(dá)能力不夠,生成人類水平的寫作或代碼仍然只是一個(gè)夢(mèng)想。

● 階段二:規(guī)模競(jìng)賽(從2015年開始):谷歌研究院的一篇里程碑式論文《注意力是你所需的一切》(Attention Is All You Need)描述了一種用于自然語言理解的新型神經(jīng)網(wǎng)絡(luò)架構(gòu),這種架構(gòu)被稱作transformers。它可以生成高質(zhì)量的語言模型,同時(shí)可并行性更強(qiáng),訓(xùn)練所需的時(shí)間也大大減少。這些模型是小樣本學(xué)習(xí)器,可以相對(duì)容易地根據(jù)特定領(lǐng)域進(jìn)行定制。

而隨著模型越來越大,其表現(xiàn)開始與人類水平相當(dāng),然后是超人類水平的結(jié)果。從2015年到2020年,用于訓(xùn)練這些模型的計(jì)算量增加了6個(gè)數(shù)量級(jí),其結(jié)果超過了人類在手寫、語音和圖像識(shí)別、閱讀理解以及語言理解方面的性能基準(zhǔn)。其中,OpenAI的GPT-3脫穎而出,該模型的性能比GPT-2有了巨大的飛躍。

盡管基礎(chǔ)研究取得了很大進(jìn)展,但這些模型并沒有得到普及。它們體積龐大,難以運(yùn)行(需要圖形處理器協(xié)調(diào)),不能廣泛訪問(不可用或僅為封閉測(cè)試版),而且作為云服務(wù)使用成本高昂。盡管存在這些限制,但是最早的生成式人工智能應(yīng)用已經(jīng)開始進(jìn)入戰(zhàn)場(chǎng)。

● 階段三:更好、更快、更便宜(從2022年開始):計(jì)算變得越來越便宜,如擴(kuò)散模型(diffusion models)等新技術(shù)降低了訓(xùn)練與運(yùn)行推理所需要的成本。研究界不斷開發(fā)出更好的算法和更大的模型。開發(fā)人員的訪問權(quán)限從封閉測(cè)試版擴(kuò)展到了公開測(cè)試版,或者在某些情況下是開源的。

對(duì)于那些一直無法訪問LLM(大語言模型)的開發(fā)人員來說,探索和應(yīng)用開發(fā)的大門現(xiàn)在已經(jīng)打開,應(yīng)用開始綻放。

● 階段四:殺手級(jí)應(yīng)用出現(xiàn)(現(xiàn)在):隨著平臺(tái)層的穩(wěn)固,模型不斷變得更好、更快、更便宜,以及模型訪問趨向于免費(fèi)和開源,應(yīng)用層的創(chuàng)造力爆發(fā)時(shí)機(jī)已經(jīng)成熟。

我們期待這些大型模型能推動(dòng)新一輪的生成式人工智能應(yīng)用,正如移動(dòng)設(shè)備通過GPS(全球定位系統(tǒng))、攝像頭和隨身連接等新功能釋放出新應(yīng)用一樣。紅杉資本預(yù)測(cè):正如十年前移動(dòng)技術(shù)的拐點(diǎn)為少數(shù)殺手級(jí)應(yīng)用開辟了市場(chǎng),預(yù)計(jì)生成式人工智能也將出現(xiàn)殺手級(jí)應(yīng)用。比賽已經(jīng)開始。

而促使紅杉資本發(fā)表這一預(yù)測(cè)的直接原因是:2022年4月,一家位于硅谷的人工智能初創(chuàng)公司突然點(diǎn)亮了整個(gè)美國創(chuàng)投界,它就是此后照亮了全世界的OpenAI。

2015年,非營利組織OpenAI由特斯拉的創(chuàng)始人埃隆·馬斯克和硅谷著名孵化器YC的前總裁薩姆·奧爾特曼等人共同出資10億美元?jiǎng)?chuàng)建。

后來,奧爾特曼在接受《紐約客》采訪時(shí)曾經(jīng)提及為什么他要去幫馬斯克創(chuàng)建OpenAI。大概意思如下。

28歲這一年,奧爾特曼突然意識(shí)到:人類不是獨(dú)一無二的。很快,計(jì)算機(jī)就能夠復(fù)制他們的大腦。在某些方面,人類可能還具有特殊性,比如創(chuàng)造力、靈感、感受情緒的能力,但是很快計(jì)算機(jī)也會(huì)有自己的欲望和人生目標(biāo)。

奧爾特曼說:“當(dāng)?shù)弥悄芸梢员荒M時(shí),我就不再認(rèn)為人類有什么獨(dú)特性了。而且相比于人類,機(jī)器還有很多優(yōu)勢(shì)——人類在輸入和輸出方面太慢,每秒只能學(xué)習(xí)兩個(gè)bit數(shù)據(jù),但是對(duì)于計(jì)算機(jī),這簡直就是慢動(dòng)作。”

2003年,瑞典哲學(xué)家尼克·博斯特羅姆曾經(jīng)提出一個(gè)著名的假設(shè):如果我們對(duì)一個(gè)全能的人工智能下命令,要求它制作盡可能多的回形針。那么,在沒有其他指令的情況下,它就會(huì)耗盡地球上所有資源來制造回形針——包括你、我身體里的原子。

也就是說,人工智能將變得無比強(qiáng)大,但是它沒有人類的價(jià)值觀。于是,為了幫助全人類做戰(zhàn)略防御,奧爾特曼決定與馬斯克一起創(chuàng)立OpenAI。

他們模擬的敵人,就是谷歌旗下的DeepMind。因?yàn)槿绻澜缟现挥幸粋€(gè)DeepMind,那么假設(shè)有一天DeepMind出了問題,也許就會(huì)出現(xiàn)一個(gè)不朽的超級(jí)獨(dú)裁者。這個(gè)獨(dú)裁者會(huì)殺光所有競(jìng)爭對(duì)手的研究人員,就像修改一個(gè)程序的bug(漏洞)一樣。

而OpenAI的第一個(gè)任務(wù),就是要從谷歌和臉書等美國科技巨頭手中奪取人工智能的人才。

不過,OpenAI也有自己的問題。因?yàn)樗某霭l(fā)點(diǎn)是完全“防御性”和“利他性”的,所以沒有人知道它想要什么——它的欲望是什么呢?(尤其是在威脅還沒有發(fā)生時(shí)。)這就像一個(gè)創(chuàng)業(yè)者昭告天下他要?jiǎng)?chuàng)業(yè)了,但是他的行為方式卻像在“帶發(fā)修行”一樣。

OpenAI募集了10億美元資金,雇用了一支由30名研究人員組成的超級(jí)強(qiáng)大的團(tuán)隊(duì)。他們想干什么呢?

馬斯克后來幫助OpenAI提出了一個(gè)策略:最好的防御方式,就是讓盡可能多的人擁有人工智能。因?yàn)槿绻澜缟厦恳粋€(gè)人都有人工智能的能力,那么就沒有任何一個(gè)人或者一小部分人可以擁有人工智能的超能力。

這也奠定了之后OpenAI商業(yè)模式的基礎(chǔ),那就是:向全世界出售自己的AI產(chǎn)品許可。

2022年4月,OpenAI向公眾發(fā)布了自己開發(fā)的機(jī)器學(xué)習(xí)模型DALL·E2,專門用于從自然語言描述中生成數(shù)字圖像;同年7月,OpenAI開始出售DALL·E2圖像生成軟件的許可。很快,DALL·E2就正式開啟了硅谷社交媒體上的一場(chǎng)AI生成藝術(shù)盛宴。

不過,讓OpenAI始料未及的是:從2022年7月開始,整個(gè)硅谷和歐洲都出現(xiàn)了幾家被全球科技界瘋狂關(guān)注的生成式人工智能初創(chuàng)公司。其中,Midjourney公司的產(chǎn)品是一款精美的藝術(shù)生成器。它沒有網(wǎng)站,功能全集成在Discord(專為社群設(shè)計(jì)的免費(fèi)網(wǎng)絡(luò)實(shí)時(shí)通話軟件與數(shù)字發(fā)行平臺(tái))的一個(gè)頻道里,并且很快就積累了約300萬用戶。人們使用這款軟件,可以在幾秒鐘之內(nèi)就生成精美而富有詩意的圖片。例如,當(dāng)你輸入提示詞“rain and yellow light”(雨和黃色的燈光)時(shí),Midjourney能夠在幾秒鐘內(nèi)生成一張“一個(gè)撐著傘在檸檬黃的夜燈下孤獨(dú)行走的人的背影”的圖片。

戴維·霍爾茨是Midjourney的創(chuàng)始人。他這樣形容自己對(duì)生成式人工智能的理解:

“我們不認(rèn)為這真的是關(guān)于藝術(shù)或者制作深度偽造品,而是關(guān)于——我們?nèi)绾螖U(kuò)展人類的想象力。因?yàn)楫?dāng)計(jì)算機(jī)的視覺想象力比99%的人類更好時(shí),這意味著什么呢?這不意味著我們將停止想象。汽車比人類行走的速度快,但這不意味著我們停止了步行。當(dāng)我們要把大量的東西移動(dòng)很遠(yuǎn)的距離時(shí),我們需要飛機(jī)、輪船或汽車。因此,我們將這項(xiàng)技術(shù)視為——‘想象力的引擎’。”

開源人工智能軟件也在這個(gè)時(shí)候興起——Stable Diffusion的突然出現(xiàn),讓整個(gè)人工智能世界都大吃一驚。通過使用Stable Diffusion,包括Stability AI和后來大名鼎鼎的Runway在內(nèi)的人工智能初創(chuàng)公司,已經(jīng)為它們的客戶開發(fā)了內(nèi)容創(chuàng)建工具。

到了這個(gè)時(shí)候,全球創(chuàng)投界已經(jīng)涌現(xiàn)出了大量狂熱的技術(shù),生成式人工智能初創(chuàng)公司獲得融資的消息,也頻頻出現(xiàn)在美國媒體和各大科技網(wǎng)站上。與此同時(shí),美國創(chuàng)投界的思想家們紛紛發(fā)表自己的看法。其中,薩姆·奧爾特曼的兩段話廣為傳播:

“生成式人工智能提醒我們,人們很難做出有關(guān)人工智能的預(yù)測(cè)。十年前,傳統(tǒng)觀點(diǎn)認(rèn)為:人工智能首先會(huì)影響體力勞動(dòng),然后影響認(rèn)知?jiǎng)趧?dòng),最后,也許有一天它可以做創(chuàng)造性工作?,F(xiàn)在看起來,它會(huì)以相反的順序進(jìn)行。”

一時(shí)之間,有關(guān)生成式人工智能的創(chuàng)造競(jìng)賽,以小時(shí)為單位在全球范圍內(nèi)展開。但僅僅是在幾個(gè)月前,硅谷還籠罩在一片烏云之中。

2022年第一季度,全球風(fēng)險(xiǎn)投資活動(dòng)出現(xiàn)回調(diào),全球風(fēng)險(xiǎn)投資總額為1600億美元,這是12個(gè)月以來的第一次下降。這種回調(diào),當(dāng)然與美股二級(jí)市場(chǎng)的“崩潰”有關(guān)。事后的一系列數(shù)據(jù)表明:此后,全球風(fēng)險(xiǎn)投資將快速地,甚至也許是殘酷地,從一個(gè)超級(jí)泡沫化、繁榮的環(huán)境,過渡到一個(gè)許多交易都沒有完成的環(huán)境。

但是有關(guān)生成式人工智能的投資,卻很快又“咆哮著”回來了。

這種從黑暗的蕭條、跌宕起伏到興奮的轉(zhuǎn)折能力,也許正是硅谷創(chuàng)業(yè)界創(chuàng)造未來的核心力量。風(fēng)險(xiǎn)投資界已經(jīng)躍躍欲試。

正如紅杉資本在《生成式人工智能:創(chuàng)意新世界》一文中所說:“生成式人工智能還處于很早期。平臺(tái)層剛剛好,而應(yīng)用空間幾乎還沒出現(xiàn)。但預(yù)計(jì)AI的殺手級(jí)應(yīng)用即將出現(xiàn),比賽開始了。”

主站蜘蛛池模板: 齐河县| 广灵县| 连云港市| 喀什市| 芦山县| 察隅县| 金川县| 嘉定区| 宜良县| 紫金县| 沁源县| 句容市| 澄城县| 连平县| 昆明市| 塘沽区| 民县| 克拉玛依市| 来凤县| 肇东市| 裕民县| 铜陵市| 南江县| 宽城| 泰顺县| 桑植县| 西宁市| 准格尔旗| 平潭县| 郎溪县| 南乐县| 青岛市| 集贤县| 安新县| 宜黄县| 泰和县| 五河县| 定襄县| 金昌市| 灵山县| 永春县|