舉報

會員
DeepSeek實戰:從提示詞到部署和實踐
最新章節:
封底
本書旨在提供一份全面、易懂的DeepSeek大模型實戰內容,通過深入淺出的講解,幫助讀者快速掌握DeepSeek的核心技術和應用場景。本書不僅涵蓋了DeepSeek的技術原理、架構設計和訓練方法,還詳細介紹了如何通過API調用、本地部署和云服務等方式將DeepSeek集成到實踐項目中。此外,本書通過大量實例和案例分析,展示了DeepSeek在不同領域的應用實踐,幫助讀者更好地理解和應用這一強大的工具。本書圖文并茂,理論翔實,案例豐富,適合從事DeepSeek開發的科研人員以及廣大的開發者作為技術參考和培訓資料,亦可作為高校本科生和研究生的教材。
目錄(156章)
倒序
- 封面
- 版權信息
- 內容簡介
- 前言
- 第1章 DeepSeek初探
- 1.1 大模型的定義
- 1.2 從GPT到DeepSeek
- 1.2.1 GPT模型的發展脈絡
- 1.2.2 DeepSeek模型的發展脈絡
- 1.2.3 技術突破:從全球競速到本土創新
- 1.2.4 應用生態的進化:從工具到生態伙伴
- 1.3 DeepSeek的核心能力和獨特優勢
- 1.3.1 核心能力
- 1.3.2 獨特優勢
- 1.4 DeepSeek的應用場景
- 1.4.1 智能客服
- 1.4.2 輔助辦公
- 1.4.3 智能家居
- 1.4.4 醫療診斷
- 1.4.5 教育學習
- 1.4.6 金融投資
- 1.4.7 智能政務
- 1.5 DeepSeek帶來的機遇
- 1.5.1 DeepSeek模型帶給個人的機遇
- 1.5.2 DeepSeek帶給中小企業的機遇
- 小結
- 第2章 DeepSeek的模型架構
- 2.1 DeepSeek-V3/R1模型的架構
- 2.2 混合專家
- 2.2.1 稠密MoE架構和稀疏MoE架構
- 2.2.2 DeepSeekMoE
- 2.2.3 無輔助損耗負載均衡
- 2.3 多頭潛在注意力
- 2.3.1 鍵值緩存簡介
- 2.3.2 RoPE簡介
- 2.3.3 傳統MHA的緩存機制的不足
- 2.3.4 低秩鍵值聯合壓縮的注意力機制
- 2.4 多Token預測
- 2.4.1 塊級并行解碼策略
- 2.4.2 Meta的MTP方法
- 2.4.3 DeepSeek的MTP方法
- 小結
- 第3章 DeepSeek的訓練架構
- 3.1 DeepSeek的訓練
- 3.1.1 基礎技術
- 3.1.2 訓練過程
- 3.2 DeepSeek在硬件層面的訓練亮點
- 3.2.1 FP8混合精度訓練
- 3.2.2 DualPipe算法
- 3.3 DeepSeek在算法層面的訓練亮點
- 3.3.1 組相對策略優化
- 3.3.2 知識蒸餾
- 3.4 DeepSeek的數據優化手段
- 小結
- 第4章 高質量提示詞
- 4.1 提示詞概述
- 4.1.1 提示詞的定義
- 4.1.2 提示詞的種類
- 4.2 新手常見誤區和陷阱
- 4.3 提示詞的設計技巧
- 4.3.1 STAR法則:讓問題更有條理
- 4.3.2 5W2H法則:全面提問的利器
- 4.3.3 CO-STAR框架:精準表達需求
- 4.3.4 CRISPE框架:激發創意和拓展深度
- 4.3.5 BROKE框架:目標導向和持續優化
- 4.3.6 借助大模型優化提示詞
- 4.4 企業層面的提示詞應用場景
- 4.4.1 傳播策略制定
- 4.4.2 執行發展制定
- 4.4.3 品牌故事生成
- 4.4.4 產品定位
- 小結
- 第5章 面向個人的DeepSeek部署
- 5.1 DeepSeek的模型
- 5.1.1 DeepSeek模型的常見版本
- 5.1.2 DeepSeek模型的版本說明
- 5.1.3 DeepSeek模型的開源協議
- 5.2 硬件需求和配置建議
- 5.2.1 存儲精度
- 5.2.2 顯存占用估算
- 5.3 軟件環境安裝和配置
- 5.3.1 Ollama安裝
- 5.3.2 使用Ollama部署DeepSeek模型
- 5.3.3 Ollama常用API
- 5.4 DeepSeek模型下載和部署
- 5.4.1 Hugging Face社區簡介
- 5.4.2 模型下載
- 5.4.3 常見大模型文件類型
- 5.5 使用Web UI構建對話界面
- 5.5.1 Open-WebUI
- 5.5.2 Hollama
- 5.5.3 ChatBox
- 小結
- 第6章 面向企業的DeepSeek API調用
- 6.1 API調用的優勢
- 6.2 常用DeepSeek API調用方式
- 6.2.1 DeepSeek官方開放平臺
- 6.2.2 DMXAPI
- 小結
- 第7章 面向企業的DeepSeek云服務部署
- 7.1 本地部署與云服務部署的對比
- 7.1.1 本地部署的特點
- 7.1.2 云服務部署的特點
- 7.2 模型推理加速框架
- 7.2.1 推理加速框架的必要性
- 7.2.2 BladeLLM
- 7.2.3 SGLang
- 7.2.4 vLLM
- 7.3 常用DeepSeek云服務部署方式
- 7.3.1 阿里云
- 7.3.2 騰訊云
- 7.3.3 華為云
- 7.3.4 火山引擎
- 7.3.5 AutoDL
- 小結
- 第8章 DeepSeek模型訓練
- 8.1 常用訓練框架
- 8.1.1 Unsloth
- 8.1.2 TRL
- 8.2 DeepSeek模型的SFT訓練
- 8.2.1 算力租用
- 8.2.2 模型下載和部署
- 8.2.3 數據預處理
- 8.2.4 模型訓練
- 8.2.5 模型推理
- 8.3 DeepSeek模型的GRPO訓練
- 8.3.1 加載模型
- 8.3.2 配置PEFT模型
- 8.3.3 數據集準備
- 8.3.4 模型訓練
- 8.3.5 模型推理
- 小結
- 第9章 DeepSeek的RAG實戰
- 9.1 用LangChain構建簡單的RAG本地系統
- 9.1.1 RAG管道構建
- 9.1.2 向量數據庫構建
- 9.1.3 Web頁面啟動
- 9.2 開源DeepSeek RAG應用案例
- 9.2.1 Local PDF Chat RAG
- 9.2.2 RAG Flow
- 小結
- 第10章 DeepSeek的Agent實戰
- 10.1 基于LlamaIndex項目構建簡單的智能體應用
- 10.1.1 軟件安裝和模型下載
- 10.1.2 構建本地知識庫
- 10.1.3 實現基于本地知識庫的智能體問答
- 10.2 基于Swarm框架構建智能體應用
- 10.2.1 Swarm框架介紹
- 10.2.2 DeepSeek模型接入
- 10.2.3 調用外部工具
- 10.3 開源Agent應用框架
- 10.3.1 Browser Use
- 10.3.2 Camel
- 小結
- 參考文獻
- 封底 更新時間:2025-06-03 14:18:21
推薦閱讀
- 巧用ChatGPT進行數據分析與挖掘
- 這就是推薦系統:核心技術原理與企業應用
- 智能浪潮:增強時代來臨
- 人工智能時代生存指南
- 類腦智能:大腦情感學習模型的應用研究
- AI時代,學什么,怎么學
- DeepSeek高效提問指南:提出好問題,才有好答案
- 人工智能初探2
- 體感交互技術
- 圖解人工智能
- 機器人驅動與控制及應用實例
- 大語言模型:基礎與前沿
- 機器學習實戰:基于Scikit-Learn、Keras和TensorFlow(原書第2版)
- 搜索:開啟智能時代的新引擎
- Web3超入門
- 深度學習:導讀手冊
- 你好啊,人工智能:你的第一本前沿科技啟蒙書
- DeepSeek實戰:從提示詞到部署和實踐
- 法律人AI指南:大模型10倍提升工作效率的方法與技巧
- TensorFlow自然語言處理
- 因果推斷與機器學習
- 大模型應用開發:核心技術與領域實踐
- 人工智能訓練師基礎(上冊)
- 智能時代:人工智能、超級計算與網絡安全
- 人工智能與人機博弈(物聯網在中國)
- Python+ChatGPT辦公自動化實戰
- 十堂極簡人工智能課
- 自適應和反應式機器人控制:動態系統法
- Spark機器學習進階實戰
- 自然語言處理應用與實戰