書名：深度強(qiáng)化學(xué)習(xí)實(shí)踐（原書第2版）
作者名： (俄)馬克西姆·拉潘
本章字?jǐn)?shù)： 302字
更新時(shí)間： 2021-08-18 17:39:30

第7章　高級(jí)強(qiáng)化學(xué)習(xí)庫

在第6章，我們實(shí)現(xiàn)了DeepMind在2015年發(fā)布的深度Q-network（DQN）模型（https://deepmind.com/research/publications/playing-atari-deep-reinforcement-learning）。這篇論文對(duì)RL領(lǐng)域產(chǎn)生了重大的影響，之前人們只是普遍認(rèn)為在RL中使用非線性近似是可能的，但DeepMind展示了具體做法。這一概念的證明激發(fā)了大家對(duì)深度Q-learning和一般RL的興趣。

本章中，我們將通過討論更高級(jí)RL庫，向RL實(shí)踐邁出新的一步。這些庫將用高階代碼塊來構(gòu)建代碼，并專注于要實(shí)現(xiàn)的方法的細(xì)節(jié)。本章大部分內(nèi)容將介紹PyTorch Agent Net（PTAN）庫，本書的剩余部分都會(huì)使用它來避免代碼重復(fù)，因此我們將對(duì)其進(jìn)行詳細(xì)的介紹。

本章將介紹：

使用高級(jí)庫的動(dòng)機(jī)，不要從頭開始重新實(shí)現(xiàn)一切。
PTAN庫以及最重要的部分，將通過代碼示例進(jìn)行說明。
針對(duì)CartPole上的DQN，使用PTAN庫來實(shí)現(xiàn)。
可以考慮的其他RL庫。

官术网_书友最值得收藏!

深度強(qiáng)化學(xué)習(xí)實(shí)踐（原書第2版）

第7章 高級(jí)強(qiáng)化學(xué)習(xí)庫

第7章　高級(jí)強(qiáng)化學(xué)習(xí)庫