官术网_书友最值得收藏!

<var id="3yn9g"></var>

<track id="3yn9g"></track>

書名：深度強化學習實踐（原書第2版）
作者名： (俄)馬克西姆·拉潘
本章字數： 191字
更新時間： 2021-08-18 17:39:25

4.6　總結

本章介紹了交叉熵方法，盡管它有局限性，但簡單且功能強大，并將其應用在了CartPole環境（取得了巨大的成功）和FrozenLake環境（效果還行）。另外，還討論了RL方法的分類，這會在本書的其余部分多次引用，因為解決RL問題的不同方法會有不同特性，從而影響了它們的適用性。

本章結束了本書的介紹性部分。下一部分將轉向更系統的RL方法研究，并討論基于價值的系列方法。接下來的章節將探索更復雜但功能更強大的深度RL工具。

主站蜘蛛池模板：吉安市| 江口县| 灵武市| 河西区| 从江县| 盖州市| 苗栗市| 贡嘎县| 育儿| 洪雅县| 上杭县| 广饶县| 桐梓县| 沙雅县| 讷河市| 新龙县| 吕梁市| 滨州市| 聂荣县| 汉沽区| 阿荣旗| 融水| 铜陵市| 达日县| 黑龙江省| 孙吴县| 天祝| 和林格尔县| 米易县| 荔波县| 新建县| 克什克腾旗| 盘山县| 巍山| 洛隆县| 梅州市| 公安县| 怀宁县| 慈溪市| 南开区| 兖州市|

<nav id="lrruc"></nav>

<li id="lrruc"></li>

<strong id="lrruc"></strong>