官术网_书友最值得收藏!

2.6 總結

本章已經開始介紹RL的實踐部分了!在本章中,我們安裝了OpenAI Gym,它能提供大量的環境。本章研究了它的基礎API,創建了一個行為隨機的智能體。

還介紹了如何以模塊化的方式擴展現存環境的功能,介紹了如何使用Monitor類錄制智能體的活動。后面的章節會大量使用這些技巧。

下一章將使用PyTorch快速回顧DL,PyTorch是DL研究人員最喜歡用的一個庫,敬請期待!

主站蜘蛛池模板: 玛曲县| 江永县| 龙井市| 略阳县| 格尔木市| 南京市| 故城县| 横山县| 康马县| 黑龙江省| 宜州市| 潜江市| 长子县| 永胜县| 甘德县| 郴州市| 紫金县| 白城市| 波密县| 岐山县| 望城县| 井陉县| 石嘴山市| 保德县| 屯留县| 阳朔县| 唐海县| 乌什县| 遵义县| 宜州市| 长春市| 南川市| 酒泉市| 黔东| 砀山县| 仁寿县| 墨竹工卡县| 吉水县| 穆棱市| 江山市| 定安县|