TRPO algorithm
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 303字
- 2021-06-24 15:18:07
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 在你身邊為你設(shè)計(jì)Ⅲ:騰訊服務(wù)設(shè)計(jì)思維與實(shí)戰(zhàn)
- 有趣的二進(jìn)制:軟件安全與逆向分析
- 使用GitOps實(shí)現(xiàn)Kubernetes的持續(xù)部署:模式、流程及工具
- Oracle RAC 11g實(shí)戰(zhàn)指南
- R數(shù)據(jù)科學(xué)實(shí)戰(zhàn):工具詳解與案例分析(鮮讀版)
- 算法與數(shù)據(jù)中臺(tái):基于Google、Facebook與微博實(shí)踐
- 數(shù)據(jù)驅(qū)動(dòng):從方法到實(shí)踐
- Dependency Injection with AngularJS
- Microsoft Power BI數(shù)據(jù)可視化與數(shù)據(jù)分析
- 計(jì)算機(jī)組裝與維護(hù)(微課版)
- Unity 2018 By Example(Second Edition)
- Access數(shù)據(jù)庫(kù)開(kāi)發(fā)從入門(mén)到精通
- 信息融合中估計(jì)算法的性能評(píng)估
- 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)-WEKA應(yīng)用技術(shù)與實(shí)踐(第二版)
- 碼上行動(dòng):利用Python與ChatGPT高效搞定Excel數(shù)據(jù)分析