舉報(bào)

會(huì)員
Joy RL:強(qiáng)化學(xué)習(xí)實(shí)踐教程
最新章節(jié):
第12章
本書是繼《EasyRL:強(qiáng)化學(xué)習(xí)教程》(俗稱“蘑菇書”)之后,為強(qiáng)化學(xué)習(xí)的讀者專門打造的一本深入實(shí)踐的全新教程。全書大部分內(nèi)容基于3位作者的實(shí)踐經(jīng)驗(yàn),涵蓋馬爾可夫決策過程、動(dòng)態(tài)規(guī)劃、免模型預(yù)測(cè)、免模型控制、深度學(xué)習(xí)基礎(chǔ)、DQN算法、DQN算法進(jìn)階、策略梯度、Actor-Critic算法、DDPG與TD3算法、PPO算法等內(nèi)容,旨在幫助讀者快速入門強(qiáng)化學(xué)習(xí)的代碼實(shí)踐,并輔以一套開源代碼框架“JoyRL”,便于讀者適應(yīng)業(yè)界應(yīng)用研究風(fēng)格的代碼。與“蘑菇書”不同,本書對(duì)強(qiáng)化學(xué)習(xí)核心理論進(jìn)行提煉,并串聯(lián)知識(shí)點(diǎn),重視強(qiáng)化學(xué)習(xí)代碼實(shí)踐的指導(dǎo)而不是對(duì)理論的詳細(xì)講解。本書適合具有一定編程基礎(chǔ)且希望快速進(jìn)入實(shí)踐應(yīng)用階段的讀者閱讀。