書名：圖解大模型：生成式AI原理與實(shí)戰(zhàn)
作者名： (沙特)杰伊·阿拉馬爾 (荷)馬爾滕·格魯滕多斯特
本章字?jǐn)?shù)： 10字
更新時(shí)間： 2025-06-06 15:42:15

第一部分　理解語(yǔ)言模型

第1章　大語(yǔ)言模型簡(jiǎn)介

人類正站在一個(gè)轉(zhuǎn)折點(diǎn)上。從 2012 年開(kāi)始，基于深度神經(jīng)網(wǎng)絡(luò)的AI 系統(tǒng)發(fā)展日新月異，如今已經(jīng)誕生了首個(gè)能夠生成與人類作品幾乎無(wú)異的文章的軟件系統(tǒng)，這個(gè)系統(tǒng)就是名為 GPT-2（Generative Pre-Trained Transformer 2，生成式預(yù)訓(xùn)練 Transformer 2）的AI 模型。2022 年 ChatGPT的發(fā)布，展示了這項(xiàng)技術(shù)將如何徹底改變我們與技術(shù)和信息交互的方式。ChatGPT 在 5 天內(nèi)達(dá)到百萬(wàn)活躍用戶，2 個(gè)月內(nèi)活躍用戶數(shù)突破 1 億。新一代 AI 模型最初只是像人一樣的聊天機(jī)器人（chatbot），但很快發(fā)展為一場(chǎng)革命性的變革，改變了我們處理翻譯、文本生成、摘要等常見(jiàn)任務(wù)的方式。它已成為程序員、教育工作者和研究人員的寶貴工具。

ChatGPT 前所未有的成功推動(dòng)了對(duì)其背后的技術(shù)——大語(yǔ)言模型（LLM）的深入研究。不同專有和開(kāi)源模型穩(wěn)步發(fā)布，逐漸接近并最終趕上了 ChatGPT的性能。可以毫不夸張地說(shuō)，幾乎所有的關(guān)注都集中在了 LLM 上。

因此，對(duì)我們而言，2023 年，作為徹底改變語(yǔ)言人工智能領(lǐng)域的一年，將永遠(yuǎn)被銘記。語(yǔ)言人工智能領(lǐng)域旨在開(kāi)發(fā)能夠理解和生成人類語(yǔ)言的系統(tǒng)。

然而，盡管 LLM 已經(jīng)存在了一段時(shí)間，但較小的模型至今仍然具有重要意義。LLM 遠(yuǎn)不只是單一的模型，語(yǔ)言人工智能領(lǐng)域還有許多其他值得探索的技術(shù)和模型。

本書旨在讓讀者深入理解 LLM 和語(yǔ)言人工智能領(lǐng)域的基本原理。本章為全書搭建框架，將介紹貫穿全書的概念和術(shù)語(yǔ)。

最重要的是，我們將在本章回答以下問(wèn)題：

● 什么是語(yǔ)言人工智能？

● 什么是 LLM ？

● LLM的常見(jiàn)使用場(chǎng)景和應(yīng)用有哪些？

● 我們?nèi)绾问褂?LLM ？

官术网_书友最值得收藏!

圖解大模型：生成式AI原理與實(shí)戰(zhàn)

第一部分 理解語(yǔ)言模型

第1章 大語(yǔ)言模型簡(jiǎn)介

第一部分　理解語(yǔ)言模型

第1章　大語(yǔ)言模型簡(jiǎn)介