- 揭秘大模型:從原理到實戰(zhàn)
- 文亮 江維
- 167字
- 2025-04-17 18:46:16
第2章 大模型理論基礎
語言模型是理解大模型技術的基礎。本章將從傳統語言模型和基于Transformer的語言模型兩個方面進行介紹,包含循環(huán)神經網絡(RNN)、長短期記憶(LSTM)網絡、門控循環(huán)單元(GRU)和GPT的核心結構Transformer等內容。本章還將通過一個機器翻譯的案例展示如何使用Transformer實現自然語言處理的任務。本章的目的是讓讀者對大模型理論基礎有初步的認識,為后面的學習打下基礎。