官术网_书友最值得收藏!

4.6 總結

本章介紹了交叉熵方法,盡管它有局限性,但簡單且功能強大,并將其應用在了CartPole環境(取得了巨大的成功)和FrozenLake環境(效果還行)。另外,還討論了RL方法的分類,這會在本書的其余部分多次引用,因為解決RL問題的不同方法會有不同特性,從而影響了它們的適用性。

本章結束了本書的介紹性部分。下一部分將轉向更系統的RL方法研究,并討論基于價值的系列方法。接下來的章節將探索更復雜但功能更強大的深度RL工具。

主站蜘蛛池模板: 吉安市| 江口县| 灵武市| 河西区| 从江县| 盖州市| 苗栗市| 贡嘎县| 育儿| 洪雅县| 上杭县| 广饶县| 桐梓县| 沙雅县| 讷河市| 新龙县| 吕梁市| 滨州市| 聂荣县| 汉沽区| 阿荣旗| 融水| 铜陵市| 达日县| 黑龙江省| 孙吴县| 天祝| 和林格尔县| 米易县| 荔波县| 新建县| 克什克腾旗| 盘山县| 巍山| 洛隆县| 梅州市| 公安县| 怀宁县| 慈溪市| 南开区| 兖州市|