Off-policy Monte Carlo control
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 422字
- 2021-06-24 15:17:37
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 數(shù)據(jù)挖掘原理與實(shí)踐
- Microsoft SQL Server企業(yè)級平臺管理實(shí)踐
- 正則表達(dá)式必知必會
- 醫(yī)療大數(shù)據(jù)挖掘與可視化
- 數(shù)據(jù)驅(qū)動:從方法到實(shí)踐
- Sybase數(shù)據(jù)庫在UNIX、Windows上的實(shí)施和管理
- 智能數(shù)據(jù)分析:入門、實(shí)戰(zhàn)與平臺構(gòu)建
- SQL Server 2012實(shí)施與管理實(shí)戰(zhàn)指南
- Oracle 11g數(shù)據(jù)庫管理員指南
- Redis 6開發(fā)與實(shí)戰(zhàn)
- Mastering Java for Data Science
- 大數(shù)據(jù):從海量到精準(zhǔn)
- Java Deep Learning Essentials
- XNA 4 3D Game Development by Example:Beginner's Guide
- Unity AI Programming Essentials