官术网_书友最值得收藏!

2.6 總結

本章已經開始介紹RL的實踐部分了!在本章中,我們安裝了OpenAI Gym,它能提供大量的環境。本章研究了它的基礎API,創建了一個行為隨機的智能體。

還介紹了如何以模塊化的方式擴展現存環境的功能,介紹了如何使用Monitor類錄制智能體的活動。后面的章節會大量使用這些技巧。

下一章將使用PyTorch快速回顧DL,PyTorch是DL研究人員最喜歡用的一個庫,敬請期待!

主站蜘蛛池模板: 祁门县| 临江市| 金昌市| 崇明县| 赣州市| 河曲县| 湟源县| 华亭县| 阿鲁科尔沁旗| 阿克| 望奎县| 新竹市| 中卫市| 阜新| 龙门县| 宁蒗| 都江堰市| 铁岭县| 霞浦县| 寿宁县| 乐都县| 潮安县| 鄯善县| 石嘴山市| 昌吉市| 龙江县| 扎囊县| 郓城县| 封丘县| 个旧市| 苍南县| 湘乡市| 甘泉县| 叶城县| 铁岭县| 根河市| 大关县| 萝北县| 呼和浩特市| 太湖县| 丁青县|