Trust Region Policy Optimization
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 1183字
- 2021-06-24 15:17:58
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- SQL Server 2012數據庫技術與應用(微課版)
- DB29forLinux,UNIX,Windows數據庫管理認證指南
- Voice Application Development for Android
- 大數據:從概念到運營
- INSTANT Cytoscape Complex Network Analysis How-to
- 科研統計思維與方法:SPSS實戰
- 達夢數據庫運維實戰
- HikariCP連接池實戰
- 視覺大數據智能分析算法實戰
- 數據挖掘競賽實戰:方法與案例
- 一本書讀懂大數據
- NoSQL數據庫原理(第2版·微課版)
- 掌中寶:電腦綜合應用技巧
- Practical Convolutional Neural Networks
- 社交網站的數據挖掘與分析(原書第2版)