DeepSeek原理與項目實戰(zhàn):大模型部署、微調(diào)與應(yīng)用開發(fā)
DeepSeek是一種基于Transformer架構(gòu)的生成式AI(ArtificialIntelligence)大模型,融合了MoE架構(gòu)、混合精度訓(xùn)練、分布式優(yōu)化等先進(jìn)技術(shù),具備強(qiáng)大的文本生成、多模態(tài)處理和任務(wù)定制化能力。本書系統(tǒng)性地介紹了開源大模型DeepSeek-V3的核心技術(shù)及其在實際開發(fā)中的深度應(yīng)用。全書分三部分共12章,涵蓋理論解析、技術(shù)實現(xiàn)和應(yīng)用實踐。本書通過深度講解與實用案例相結(jié)合的方式,幫助讀者理解DeepSeek大模型從原理到開發(fā)的完整流程,學(xué)習(xí)新技術(shù)的實現(xiàn)方法與優(yōu)化策略,全面提升在大模型領(lǐng)域的理論素養(yǎng)與開發(fā)能力。
·17.1萬字