深度強(qiáng)化學(xué)習(xí)實(shí)踐(原書第2版)
本書的主題是強(qiáng)化學(xué)習(xí)(ReinforcementLearning,RL),它是機(jī)器學(xué)習(xí)(MachineLearning,ML)的一個(gè)分支,強(qiáng)調(diào)如何解決在復(fù)雜環(huán)境中選擇最優(yōu)動(dòng)作時(shí)產(chǎn)生的通用且極具挑戰(zhàn)的問題。學(xué)習(xí)過程僅由獎(jiǎng)勵(lì)值和從環(huán)境中獲得的觀察驅(qū)動(dòng)。該模型非常通用,能應(yīng)用于多個(gè)真實(shí)場(chǎng)景,從玩游戲到優(yōu)化復(fù)雜制造過程都能涵蓋。
·29萬字