官术网_书友最值得收藏!

前言

為何寫作本書

自人類在20世紀(jì)40年代發(fā)明第一臺計算機(jī)以來,計算機(jī)科學(xué)一直在高速發(fā)展。在過去的幾十年里,計算機(jī)的計算速度和存儲容量都大幅提高,促進(jìn)了人工智能(Artificial Intelligence,AI)技術(shù)的發(fā)展和應(yīng)用。隨著深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展,自然語言處理迅速崛起為人工智能領(lǐng)域的核心研究方向。在這個過程中,大語言模型(Large Language Model,LLM,本書簡稱為“大模型”)應(yīng)運而生,成為自然語言處理領(lǐng)域近年來的一個重要成果。2022年11月30日,OpenAI推出新一代大模型ChatGPT,它表現(xiàn)出了令人驚艷的對話效果,回復(fù)有條理、有邏輯且多輪對話效果出色,引起了人們的廣泛關(guān)注。

ChatGPT的出圈引發(fā)了許多人對它和大模型工作原理的好奇。有人誤以為ChatGPT的工作方式類似于搜索引擎,背后有一個存儲海量文本的“數(shù)據(jù)庫”,ChatGPT通過在庫中檢索相關(guān)內(nèi)容與用戶進(jìn)行交互。事實上并非如此,ChatGPT更像是一個讀過海量書籍的智者,在讀懂了所有內(nèi)容之后,再將這些內(nèi)容按照人們期望的方式進(jìn)行回復(fù)。鑒于大家認(rèn)識上的誤區(qū),為了幫助大家深入了解ChatGPT是什么,它是如何工作的,又將如何改變我們的生活,筆者萌生了寫作本書的想法。

本書主要內(nèi)容

本書共10章,從邏輯上分為四部分:

第一部分(第1~4章)由語言模型的基本概念入手,介紹了大模型的基礎(chǔ)構(gòu)件、技術(shù)發(fā)展的脈絡(luò)及范式,以及模型對齊的方法。ChatGPT是一個大模型,而大模型首先是一個語言模型,語言模型是一種基于機(jī)器學(xué)習(xí)技術(shù)的自然語言處理模型,它可以學(xué)習(xí)語言的概率分布,從而實現(xiàn)對語言的理解和生成。大模型是一種新的技術(shù)范式,相較于傳統(tǒng)語言模型,它不僅 “大”,而且可以理解人類的意圖,并完成相應(yīng)的指令與任務(wù),也就是所謂的“對齊”與“指令跟隨”。經(jīng)過精心的訓(xùn)練,大模型甚至可以完成推理、規(guī)劃和具有創(chuàng)造性的復(fù)雜任務(wù)。

第二部分(第5章和第6章)詳細(xì)介紹了大模型的評測與分布式訓(xùn)練的基本原理。大模型的訓(xùn)練離不開算法、數(shù)據(jù)和算力的支撐,是一項需要大量投入的系統(tǒng)性工程。首先,研究者需要設(shè)計精巧的算法使得模型可以有效處理海量的數(shù)據(jù),從而解決語言的復(fù)雜性和上下文相關(guān)性等挑戰(zhàn)。其次,數(shù)據(jù)也是訓(xùn)練大模型的關(guān)鍵因素,這意味著我們需要收集、清洗和標(biāo)注大規(guī)模語料庫,以獲得足夠的高質(zhì)量訓(xùn)練數(shù)據(jù)。最后,隨著數(shù)據(jù)和模型規(guī)模的擴(kuò)大,訓(xùn)練模型所需要的算力和硬件資源也隨之不斷增加。得益于分布式訓(xùn)練和并行計算優(yōu)化,大模型的訓(xùn)練變得可行。

第三部分(第7~9章)著重介紹了大模型在垂直場景的應(yīng)用、知識融合與工具使用的方法及大模型優(yōu)化的高級話題。大模型具有廣泛的應(yīng)用前景,相較于傳統(tǒng)語言模型,大模型的適用場景更多,性能也更出色。它既可以作為客服助手,扮演各種角色與用戶進(jìn)行交互并完成任務(wù),又可以用于人工智能生成,協(xié)助用戶撰寫文章或報告,還可以用于翻譯任務(wù),理解源語言的內(nèi)容并生成目標(biāo)語言翻譯結(jié)果。此外,它還可以作為生產(chǎn)力工具編寫代碼,大幅提升程序員的編碼效率。隨著大模型技術(shù)的發(fā)展,這些應(yīng)用的上限也在不斷取得突破,同時有更多創(chuàng)新型應(yīng)用不斷涌現(xiàn)。

第四部分(第10章)展望了大模型未來的發(fā)展方向和挑戰(zhàn)。盡管大模型在眾多領(lǐng)域展現(xiàn)出卓越的性能,但也存在一些局限性。例如,大模型在生成輸出時常常會編造一些事實,即使這類錯誤屬于罕見情況,也對回答的可信度和可靠性造成了嚴(yán)重影響。此外,安全性問題也備受關(guān)注。若大模型被不當(dāng)使用,可能成為虛假新聞或釣魚郵件的源頭,甚至成為不法分子進(jìn)行違法犯罪活動的“幫兇”。

全書力求系統(tǒng)和完備,在使各章內(nèi)容逐步遞進(jìn)的同時,也兼顧了各章內(nèi)容的獨立性。讀者可根據(jù)需求按章順序?qū)W習(xí)或選擇特定內(nèi)容深入研究。希望本書能夠幫助讀者深入了解大模型相關(guān)知識,同時能夠促進(jìn)大模型技術(shù)的發(fā)展和應(yīng)用。

本書讀者對象

·計算機(jī)科學(xué)、人工智能、自然語言處理等領(lǐng)域的專業(yè)人士和學(xué)者。

·對大模型感興趣的普通讀者。

資源和勘誤

限于作者水平,書中難免存在疏漏或不足之處,歡迎讀者批評指正。讀者可通過電子郵件llmbookfeedback@gmail.com聯(lián)系我們,期待收到讀者的寶貴意見和建議。

蘇之陽  

2024年5月  

主站蜘蛛池模板: 隆德县| 太康县| 渑池县| 康定县| 巴东县| 离岛区| 内黄县| 吴旗县| 建水县| 大同市| 思南县| 隆林| 连城县| 巴塘县| 大名县| 曲沃县| 喀喇沁旗| 商水县| 醴陵市| 桃源县| 灵璧县| 涟水县| 南昌市| 大姚县| 德阳市| 孝昌县| 沁阳市| 建德市| 伊金霍洛旗| 台州市| SHOW| 克拉玛依市| 礼泉县| 岳阳县| 建平县| 云龙县| 淄博市| 东丽区| 手机| 信丰县| 大厂|