The epsilon-greedy policy
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 202字
- 2021-06-24 15:17:42
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- GitHub Essentials
- 大規模數據分析和建模:基于Spark與R
- 卷積神經網絡的Python實現
- Redis應用實例
- 數據結構與算法(C語言版)
- 區塊鏈通俗讀本
- 區塊鏈:看得見的信任
- 智能數據時代:企業大數據戰略與實戰
- 大數據架構商業之路:從業務需求到技術方案
- 數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow
- Instant Autodesk AutoCAD 2014 Customization with .NET
- 深入理解InfluxDB:時序數據庫詳解與實踐
- 大數據技術原理與應用:概念、存儲、處理、分析與應用
- 精通Neo4j
- Nagios Core Administrators Cookbook