官术网_书友最值得收藏!

書名：深度強化學習實踐（原書第2版）
作者名： (俄)馬克西姆·拉潘
本章字數： 177字
更新時間： 2021-08-18 17:39:17

第2章　OpenAI Gym

繼第1章討論了這么多強化學習（RL）的理論概念之后，我們來做一些實踐！本章將介紹OpenAI Gym的基礎，它是一個能提供智能體統一API以及很多RL環境的庫。有了它就不需要寫樣板代碼了。

你將寫下第一個有隨機行為的智能體，并借此來進一步熟悉所介紹的RL的基本概念。在本章結束時，你將能理解以下內容：

將智能體插入RL框架所需的高層次要求。
基本、純Python實現的隨機RL智能體。
OpenAI Gym。

主站蜘蛛池模板：宁明县| 甘南县| 永康市| 京山县| 桃园市| 偃师市| 全州县| 个旧市| 万荣县| 黄浦区| 武城县| 绥宁县| 白朗县| 老河口市| 新乡市| 桂东县| 阿拉尔市| 洱源县| 类乌齐县| 宣恩县| 华容县| 旬阳县| 宁安市| 邵阳县| 友谊县| 武宁县| 乌拉特后旗| 吴桥县| 林芝县| 桐乡市| 鄄城县| 枣庄市| 京山县| 调兵山市| 长丰县| 武夷山市| 余干县| 广德县| 团风县| 刚察县| 滨州市|