- 深度強化學習實踐(原書第2版)
- (俄)馬克西姆·拉潘
- 191字
- 2021-08-18 17:39:25
4.6 總結
本章介紹了交叉熵方法,盡管它有局限性,但簡單且功能強大,并將其應用在了CartPole環境(取得了巨大的成功)和FrozenLake環境(效果還行)。另外,還討論了RL方法的分類,這會在本書的其余部分多次引用,因為解決RL問題的不同方法會有不同特性,從而影響了它們的適用性。
本章結束了本書的介紹性部分。下一部分將轉向更系統的RL方法研究,并討論基于價值的系列方法。接下來的章節將探索更復雜但功能更強大的深度RL工具。