Joy RL:強化學習實踐教程
本書是繼《EasyRL:強化學習教程》(俗稱“蘑菇書”)之后,為強化學習的讀者專門打造的一本深入實踐的全新教程。全書大部分內容基于3位作者的實踐經驗,涵蓋馬爾可夫決策過程、動態規劃、免模型預測、免模型控制、深度學習基礎、DQN算法、DQN算法進階、策略梯度、Actor-Critic算法、DDPG與TD3算法、PPO算法等內容,旨在幫助讀者快速入門強化學習的代碼實踐,并輔以一套開源代碼框架“JoyRL”,便于讀者適應業界應用研究風格的代碼。與“蘑菇書”不同,本書對強化學習核心理論進行提煉,并串聯知識點,重視強化學習代碼實踐的指導而不是對理論的詳細講解。本書適合具有一定編程基礎且希望快速進入實踐應用階段的讀者閱讀。
·7.8萬字