官术网_书友最值得收藏!

第7章 高級(jí)強(qiáng)化學(xué)習(xí)庫

在第6章,我們實(shí)現(xiàn)了DeepMind在2015年發(fā)布的深度Q-network(DQN)模型(https://deepmind.com/research/publications/playing-atari-deep-reinforcement-learning)。這篇論文對(duì)RL領(lǐng)域產(chǎn)生了重大的影響,之前人們只是普遍認(rèn)為在RL中使用非線性近似是可能的,但DeepMind展示了具體做法。這一概念的證明激發(fā)了大家對(duì)深度Q-learning和一般RL的興趣。

本章中,我們將通過討論更高級(jí)RL庫,向RL實(shí)踐邁出新的一步。這些庫將用高階代碼塊來構(gòu)建代碼,并專注于要實(shí)現(xiàn)的方法的細(xì)節(jié)。本章大部分內(nèi)容將介紹PyTorch Agent Net(PTAN)庫,本書的剩余部分都會(huì)使用它來避免代碼重復(fù),因此我們將對(duì)其進(jìn)行詳細(xì)的介紹。

本章將介紹:

  • 使用高級(jí)庫的動(dòng)機(jī),不要從頭開始重新實(shí)現(xiàn)一切。
  • PTAN庫以及最重要的部分,將通過代碼示例進(jìn)行說明。
  • 針對(duì)CartPole上的DQN,使用PTAN庫來實(shí)現(xiàn)。
  • 可以考慮的其他RL庫。
主站蜘蛛池模板: 富民县| 扶余县| 鸡西市| 华亭县| 乌兰察布市| 阳泉市| 武城县| 甘洛县| 普安县| 西畴县| 清镇市| 抚松县| 灌云县| 即墨市| 德惠市| 景东| 抚顺市| 揭东县| 邢台县| 定陶县| 蓝山县| 同德县| 桃园县| 山阴县| 禄丰县| 渭南市| 宁南县| 四平市| 论坛| 宁陕县| 黄骅市| 陈巴尔虎旗| 谷城县| 平罗县| 进贤县| 南木林县| 周口市| 台南市| 水富县| 平阳县| 新兴县|