Policy gradient
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 393字
- 2021-06-24 15:17:57
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 計算機組成原理與接口技術:基于MIPS架構實驗教程(第2版)
- SQL Server 2016 數據庫教程(第4版)
- 正則表達式必知必會
- Visual Studio 2015 Cookbook(Second Edition)
- Voice Application Development for Android
- 新型數據庫系統:原理、架構與實踐
- Learning JavaScriptMVC
- Enterprise Integration with WSO2 ESB
- Scratch 3.0 藝術進階
- 中國數字流域
- 從0到1:JavaScript 快速上手
- 深入淺出 Hyperscan:高性能正則表達式算法原理與設計
- 大數據治理與安全:從理論到開源實踐
- Splunk智能運維實戰
- Python金融數據挖掘與分析實戰