Trust Region Policy Optimization and Proximal Policy Optimization
- TensorFlow Reinforcement Learning Quick Start Guide
- Kaushik Balakrishnan
- 203字
- 2021-06-24 15:29:25
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 后稀缺:自動化與未來工作
- 輕松學C語言
- ABB工業機器人編程全集
- Circos Data Visualization How-to
- IoT Penetration Testing Cookbook
- 機器自動化控制器原理與應用
- 流處理器研究與設計
- 大學計算機應用基礎
- STM32嵌入式微控制器快速上手
- 自動控制理論(非自動化專業)
- Java Web整合開發全程指南
- 精通數據科學算法
- Mastering ServiceNow Scripting
- SAP Business Intelligence Quick Start Guide
- Working with Linux:Quick Hacks for the Command Line