Chapter 11: Policy Gradients and Optimization
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 147字
- 2021-06-24 15:18:32
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 計算機綜合設計實驗指導
- 數據分析實戰:基于EXCEL和SPSS系列工具的實踐
- Visual Studio 2015 Cookbook(Second Edition)
- 文本數據挖掘:基于R語言
- 中國數字流域
- 大數據架構和算法實現之路:電商系統的技術實戰
- Remote Usability Testing
- 深入淺出 Hyperscan:高性能正則表達式算法原理與設計
- INSTANT Android Fragmentation Management How-to
- Unity 2018 By Example(Second Edition)
- Access數據庫開發從入門到精通
- openGauss數據庫核心技術
- MySQL數據庫應用與管理
- 智能與數據重構世界
- 一本書讀懂大數據