- 深度強(qiáng)化學(xué)習(xí)實(shí)踐(原書第2版)
- (俄)馬克西姆·拉潘
- 302字
- 2021-08-18 17:39:30
第7章 高級(jí)強(qiáng)化學(xué)習(xí)庫
在第6章,我們實(shí)現(xiàn)了DeepMind在2015年發(fā)布的深度Q-network(DQN)模型(https://deepmind.com/research/publications/playing-atari-deep-reinforcement-learning)。這篇論文對(duì)RL領(lǐng)域產(chǎn)生了重大的影響,之前人們只是普遍認(rèn)為在RL中使用非線性近似是可能的,但DeepMind展示了具體做法。這一概念的證明激發(fā)了大家對(duì)深度Q-learning和一般RL的興趣。
本章中,我們將通過討論更高級(jí)RL庫,向RL實(shí)踐邁出新的一步。這些庫將用高階代碼塊來構(gòu)建代碼,并專注于要實(shí)現(xiàn)的方法的細(xì)節(jié)。本章大部分內(nèi)容將介紹PyTorch Agent Net(PTAN)庫,本書的剩余部分都會(huì)使用它來避免代碼重復(fù),因此我們將對(duì)其進(jìn)行詳細(xì)的介紹。
本章將介紹:
- 使用高級(jí)庫的動(dòng)機(jī),不要從頭開始重新實(shí)現(xiàn)一切。
- PTAN庫以及最重要的部分,將通過代碼示例進(jìn)行說明。
- 針對(duì)CartPole上的DQN,使用PTAN庫來實(shí)現(xiàn)。
- 可以考慮的其他RL庫。
推薦閱讀
- 虛擬現(xiàn)實(shí):商業(yè)化應(yīng)用及影響
- AI時(shí)代,學(xué)什么,怎么學(xué)
- 自己動(dòng)手制作無人機(jī)
- 樹莓派4與人工智能實(shí)戰(zhàn)項(xiàng)目
- 圖解大模型:生成式AI原理與實(shí)戰(zhàn)
- 洞見未來的“元宇宙”世界(套裝8冊)
- 深度學(xué)習(xí)
- 人形機(jī)器人(原書第2版)
- 自然語言處理技術(shù):文本信息抽取及應(yīng)用研究
- 機(jī)器人驅(qū)動(dòng)與控制及應(yīng)用實(shí)例
- AI幫你贏:人人都能用的AI方法論
- AI賦能項(xiàng)目經(jīng)理:10倍提升項(xiàng)目管理效率
- 揭秘大模型:從原理到實(shí)戰(zhàn)
- 合成生物學(xué)智能化設(shè)計(jì)與應(yīng)用
- FANUC工業(yè)機(jī)器人實(shí)操與應(yīng)用技巧