官术网_书友最值得收藏!

2.6 總結

本章已經開始介紹RL的實踐部分了!在本章中,我們安裝了OpenAI Gym,它能提供大量的環(huán)境。本章研究了它的基礎API,創(chuàng)建了一個行為隨機的智能體。

還介紹了如何以模塊化的方式擴展現(xiàn)存環(huán)境的功能,介紹了如何使用Monitor類錄制智能體的活動。后面的章節(jié)會大量使用這些技巧。

下一章將使用PyTorch快速回顧DL,PyTorch是DL研究人員最喜歡用的一個庫,敬請期待!

主站蜘蛛池模板: 成都市| 彭山县| 梁平县| 陈巴尔虎旗| 个旧市| 石泉县| 富阳市| 西林县| 大余县| 梁平县| 长顺县| 曲沃县| 灵璧县| 武隆县| 砚山县| 图片| 逊克县| 嵩明县| 平凉市| 绥芬河市| 门源| 定安县| 东宁县| 广东省| 通州市| 祁东县| 远安县| 牡丹江市| 西乌珠穆沁旗| 永福县| 扎鲁特旗| 于田县| 桐城市| 德钦县| 翁源县| 敖汉旗| 夏津县| 汕尾市| 太湖县| 兴国县| 仁寿县|