On-policy Monte Carlo control
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 884字
- 2021-06-24 15:17:37
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 數據挖掘原理與實踐
- Python數據分析:基于Plotly的動態可視化繪圖
- gnuplot Cookbook
- Chef Essentials
- 聯動Oracle:設計思想、架構實現與AWR報告
- 從實踐中學習sqlmap數據庫注入測試
- Doris實時數倉實戰
- Mastering ROS for Robotics Programming(Second Edition)
- 實現領域驅動設計
- 大數據分析:R基礎及應用
- Scratch 2.0 Game Development HOTSHOT
- Microsoft Dynamics NAV 2015 Professional Reporting
- 云原生架構:從技術演進到最佳實踐
- 基于數據發布的隱私保護模型研究
- 數據庫原理及應用實驗:基于GaussDB的實現方法