Proximal Policy Optimization
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 482字
- 2021-06-24 15:17:59
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 大規模數據分析和建模:基于Spark與R
- 有趣的二進制:軟件安全與逆向分析
- Modern Programming: Object Oriented Programming and Best Practices
- iOS and OS X Network Programming Cookbook
- Spark核心技術與高級應用
- Python數據分析:基于Plotly的動態可視化繪圖
- 深入淺出Greenplum分布式數據庫:原理、架構和代碼分析
- 計算機應用基礎教程上機指導與習題集(微課版)
- Splunk智能運維實戰
- Construct 2 Game Development by Example
- Hadoop大數據開發案例教程與項目實戰(在線實驗+在線自測)
- 大數據分析:數據倉庫項目實戰
- 新手學會計(2013-2014實戰升級版)
- 大數據數學基礎(Python語言描述)
- MySQL技術內幕:InnoDB存儲引擎