Theory behind TRPO
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 606字
- 2021-06-24 15:18:06
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 計算機組成原理與接口技術:基于MIPS架構實驗教程(第2版)
- Java Data Science Cookbook
- 復雜性思考:復雜性科學和計算模型(原書第2版)
- 數據之巔:數據的本質與未來
- Oracle RAC 11g實戰指南
- Mastering Machine Learning with R(Second Edition)
- Starling Game Development Essentials
- Spark分布式處理實戰
- 中文版Access 2007實例與操作
- 領域驅動設計精粹
- 工業大數據融合體系結構與關鍵技術
- 推薦系統全鏈路設計:原理解讀與業務實踐
- Python金融數據挖掘與分析實戰
- C# 7 and .NET Core 2.0 High Performance
- GameMaker Game Programming with GML