- 圖解大模型:生成式AI原理與實戰
- (沙特)杰伊·阿拉馬爾 (荷)馬爾滕·格魯滕多斯特
- 591字
- 2025-06-06 15:42:15
第一部分 理解語言模型
第1章 大語言模型簡介
人類正站在一個轉折點上。從 2012 年開始,基于深度神經網絡的AI 系統發展日新月異,如今已經誕生了首個能夠生成與人類作品幾乎無異的文章的軟件系統,這個系統就是名為 GPT-2(Generative Pre-Trained Transformer 2,生成式預訓練 Transformer 2)的AI 模型。2022 年 ChatGPT的發布,展示了這項技術將如何徹底改變我們與技術和信息交互的方式。ChatGPT 在 5 天內達到百萬活躍用戶,2 個月內活躍用戶數突破 1 億。新一代 AI 模型最初只是像人一樣的聊天機器人(chatbot),但很快發展為一場革命性的變革,改變了我們處理翻譯、文本生成、摘要等常見任務的方式。它已成為程序員、教育工作者和研究人員的寶貴工具。
ChatGPT 前所未有的成功推動了對其背后的技術——大語言模型(LLM)的深入研究。不同專有和開源模型穩步發布,逐漸接近并最終趕上了 ChatGPT的性能。可以毫不夸張地說,幾乎所有的關注都集中在了 LLM 上。
因此,對我們而言,2023 年,作為徹底改變語言人工智能領域的一年,將永遠被銘記。語言人工智能領域旨在開發能夠理解和生成人類語言的系統。
然而,盡管 LLM 已經存在了一段時間,但較小的模型至今仍然具有重要意義。LLM 遠不只是單一的模型,語言人工智能領域還有許多其他值得探索的技術和模型。
本書旨在讓讀者深入理解 LLM 和語言人工智能領域的基本原理。本章為全書搭建框架,將介紹貫穿全書的概念和術語。
最重要的是,我們將在本章回答以下問題:
● 什么是語言人工智能?
● 什么是 LLM ?
● LLM的常見使用場景和應用有哪些?
● 我們如何使用 LLM ?