ChatGPT原理與實戰:大型語言模型的算法、技術和私有化
這是一本系統梳理并深入解析ChatGPT核心技術、算法實現、工作原理、訓練方法的著作,也是一本能指導你搭建專屬ChatGPT和實現大模型遷移及私有化的著作。本書得到了MOSS系統負責人邱錫鵬等多位專家的高度評價和鼎力推薦。具體地,通過本書你能了解或掌握以下知識:ChatGPT的工作流程和技術棧;ChatGPT的工作原理和算法實現;基于Transformer架構的一系列預訓練語言模型的原理;強化學習的基礎知識;提示學習與大模型涌現出的上下文學習、思維鏈;大模型的訓練方法及常見的分布式訓練框架;基于人工反饋的強化學習整體框架;從零搭建類ChatGPT模型,模擬完整的ChatGPT訓練過程。本書集理論、實戰和產業應用于一體,提供大量經詳細注釋的代碼,方便讀者理解和實操。總之,不管你是想深入研究ChatGPT本身,還是正在研發或使用其他大模型,本書都應該能給你頗具價值的技術啟發與思考,讓你在大模型的路上快速前行,少走彎路。
·13.2萬字