Chapter 11: Policy Gradients and Optimization
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 147字
- 2021-06-24 15:18:32
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 同步:秩序如何從混沌中涌現
- Python數據挖掘:入門、進階與實用案例分析
- Java Data Science Cookbook
- 虛擬化與云計算
- Architects of Intelligence
- Learning Spring Boot
- Mastering Machine Learning with R(Second Edition)
- Ceph源碼分析
- Learning Proxmox VE
- 智能數據時代:企業大數據戰略與實戰
- MySQL 8.x從入門到精通(視頻教學版)
- Hands-On Mathematics for Deep Learning
- 深入淺出 Hyperscan:高性能正則表達式算法原理與設計
- LabVIEW 完全自學手冊
- 探索新型智庫發展之路:藍迪國際智庫報告·2015(下冊)