- 深度強化學習實踐(原書第2版)
- (俄)馬克西姆·拉潘
- 157字
- 2021-08-18 17:39:19
2.6 總結
本章已經開始介紹RL的實踐部分了!在本章中,我們安裝了OpenAI Gym,它能提供大量的環(huán)境。本章研究了它的基礎API,創(chuàng)建了一個行為隨機的智能體。
還介紹了如何以模塊化的方式擴展現(xiàn)存環(huán)境的功能,介紹了如何使用Monitor
類錄制智能體的活動。后面的章節(jié)會大量使用這些技巧。
下一章將使用PyTorch快速回顧DL,PyTorch是DL研究人員最喜歡用的一個庫,敬請期待!
推薦閱讀
- 機器人設計與制作
- 智能控制與強化學習:先進值迭代評判設計
- 聯(lián)邦學習實戰(zhàn)
- 工業(yè)人工智能
- 玩轉ChatGPT:秒變AI提問和追問高手
- AI時代程序員開發(fā)之道:ChatGPT讓程序員插上翅膀
- C#神經網(wǎng)絡編程
- Mahout算法解析與案例實戰(zhàn)
- PyTorch神經網(wǎng)絡實戰(zhàn):移動端圖像處理
- OpenCV4.5計算機視覺開發(fā)實戰(zhàn):基于Python
- IBM商業(yè)價值報告:認知計算與人工智能
- 里武林的沉淪囈語:AI人工智能游戲概念設定集
- AI會取代我們嗎?(The Big Idea 21世紀讀本)
- 與機器人共舞
- AI進化論:解碼人工智能商業(yè)場景與案例