- 圖解大模型:生成式AI原理與實(shí)戰(zhàn)
- (沙特)杰伊·阿拉馬爾 (荷)馬爾滕·格魯滕多斯特
- 10字
- 2025-06-06 15:42:15
第一部分 理解語(yǔ)言模型
第1章 大語(yǔ)言模型簡(jiǎn)介
人類正站在一個(gè)轉(zhuǎn)折點(diǎn)上。從 2012 年開(kāi)始,基于深度神經(jīng)網(wǎng)絡(luò)的AI 系統(tǒng)發(fā)展日新月異,如今已經(jīng)誕生了首個(gè)能夠生成與人類作品幾乎無(wú)異的文章的軟件系統(tǒng),這個(gè)系統(tǒng)就是名為 GPT-2(Generative Pre-Trained Transformer 2,生成式預(yù)訓(xùn)練 Transformer 2)的AI 模型。2022 年 ChatGPT的發(fā)布,展示了這項(xiàng)技術(shù)將如何徹底改變我們與技術(shù)和信息交互的方式。ChatGPT 在 5 天內(nèi)達(dá)到百萬(wàn)活躍用戶,2 個(gè)月內(nèi)活躍用戶數(shù)突破 1 億。新一代 AI 模型最初只是像人一樣的聊天機(jī)器人(chatbot),但很快發(fā)展為一場(chǎng)革命性的變革,改變了我們處理翻譯、文本生成、摘要等常見(jiàn)任務(wù)的方式。它已成為程序員、教育工作者和研究人員的寶貴工具。
ChatGPT 前所未有的成功推動(dòng)了對(duì)其背后的技術(shù)——大語(yǔ)言模型(LLM)的深入研究。不同專有和開(kāi)源模型穩(wěn)步發(fā)布,逐漸接近并最終趕上了 ChatGPT的性能。可以毫不夸張地說(shuō),幾乎所有的關(guān)注都集中在了 LLM 上。
因此,對(duì)我們而言,2023 年,作為徹底改變語(yǔ)言人工智能領(lǐng)域的一年,將永遠(yuǎn)被銘記。語(yǔ)言人工智能領(lǐng)域旨在開(kāi)發(fā)能夠理解和生成人類語(yǔ)言的系統(tǒng)。
然而,盡管 LLM 已經(jīng)存在了一段時(shí)間,但較小的模型至今仍然具有重要意義。LLM 遠(yuǎn)不只是單一的模型,語(yǔ)言人工智能領(lǐng)域還有許多其他值得探索的技術(shù)和模型。
本書旨在讓讀者深入理解 LLM 和語(yǔ)言人工智能領(lǐng)域的基本原理。本章為全書搭建框架,將介紹貫穿全書的概念和術(shù)語(yǔ)。
最重要的是,我們將在本章回答以下問(wèn)題:
● 什么是語(yǔ)言人工智能?
● 什么是 LLM ?
● LLM的常見(jiàn)使用場(chǎng)景和應(yīng)用有哪些?
● 我們?nèi)绾问褂?LLM ?
- 自動(dòng)駕駛:人工智能理論與實(shí)踐
- 深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)實(shí)戰(zhàn)
- TensorFlow學(xué)習(xí)指南:深度學(xué)習(xí)系統(tǒng)構(gòu)建詳解
- 深入淺出AI算法:基礎(chǔ)概覽
- 智能制造時(shí)代的研發(fā)智慧:知識(shí)工程2.0
- 機(jī)器人制作從入門到精通(第2版)
- 物聯(lián)網(wǎng)之云:云平臺(tái)搭建與大數(shù)據(jù)處理
- 人工智能實(shí)戰(zhàn)進(jìn)階導(dǎo)引
- 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)技術(shù)
- 人工智能原理與應(yīng)用教程
- 深度學(xué)習(xí)之TensorFlow:入門、原理與進(jìn)階實(shí)戰(zhàn)
- AI:人工智能的本質(zhì)與未來(lái)
- 圖解人工智能
- 人工智能算法(卷3):深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)
- 機(jī)器人愛(ài)好者(第3輯)