Python強(qiáng)化學(xué)習(xí):算法、核心技術(shù)與行業(yè)應(yīng)用
本書使用受現(xiàn)實(shí)世界商業(yè)和行業(yè)問題啟發(fā)的實(shí)際示例來講授強(qiáng)化學(xué)習(xí)技術(shù)的相關(guān)知識。本書分為四部分:第一部分涵蓋強(qiáng)化學(xué)習(xí)的必要背景,包括定義、數(shù)學(xué)基礎(chǔ)和強(qiáng)化學(xué)習(xí)解決方案的概述;第二部分深入介紹最先進(jìn)的強(qiáng)化學(xué)習(xí)算法(規(guī)模化的深度Q-學(xué)習(xí)、基于策略的方法、基于模型的方法、多智能體強(qiáng)化學(xué)習(xí)等),包括每種算法的優(yōu)缺點(diǎn);第三部分介紹強(qiáng)化學(xué)習(xí)中的高級技術(shù),包括機(jī)器教學(xué)、泛化和域隨機(jī)化、元強(qiáng)化學(xué)習(xí)等主題,還涵蓋強(qiáng)化學(xué)習(xí)中有助于改進(jìn)模型的各種高級主題;第四部分講解強(qiáng)化學(xué)習(xí)的各種應(yīng)用,例如自主系統(tǒng)、供應(yīng)鏈管理、營銷和金融、智慧城市與網(wǎng)絡(luò)安全等,并討論強(qiáng)化學(xué)習(xí)領(lǐng)域的一些挑戰(zhàn)及未來方向。學(xué)完本書,你將掌握如何訓(xùn)練和部署自己的強(qiáng)化學(xué)習(xí)智能體來解決強(qiáng)化學(xué)習(xí)問題。
·19.5萬字