書名: 深度強化學習實踐(原書第2版)作者名: (俄)馬克西姆·拉潘本章字數: 177字更新時間: 2021-08-18 17:39:17
第2章 OpenAI Gym
繼第1章討論了這么多強化學習(RL)的理論概念之后,我們來做一些實踐!本章將介紹OpenAI Gym的基礎,它是一個能提供智能體統一API以及很多RL環境的庫。有了它就不需要寫樣板代碼了。
你將寫下第一個有隨機行為的智能體,并借此來進一步熟悉所介紹的RL的基本概念。在本章結束時,你將能理解以下內容:
- 將智能體插入RL框架所需的高層次要求。
- 基本、純Python實現的隨機RL智能體。
- OpenAI Gym。