The upper confidence bound algorithm
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 669字
- 2021-06-24 15:17:42
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- Greenplum:從大數(shù)據(jù)戰(zhàn)略到實現(xiàn)
- INSTANT Cytoscape Complex Network Analysis How-to
- 數(shù)據(jù)驅(qū)動設計:A/B測試提升用戶體驗
- 達夢數(shù)據(jù)庫性能優(yōu)化
- 中文版Access 2007實例與操作
- 數(shù)據(jù)庫與數(shù)據(jù)處理:Access 2010實現(xiàn)
- SIEMENS數(shù)控技術(shù)應用工程師:SINUMERIK 840D-810D數(shù)控系統(tǒng)功能應用與維修調(diào)整教程
- Access 2016數(shù)據(jù)庫應用基礎(chǔ)
- PostgreSQL高可用實戰(zhàn)
- MySQL數(shù)據(jù)庫應用與管理
- 區(qū)塊鏈應用開發(fā)指南:業(yè)務場景剖析與實戰(zhàn)
- AI Crash Course
- Mastering Java for Data Science
- 元宇宙基石:Web3.0與分布式存儲
- Learning Game AI Programming with Lua