Python強化學習:算法、核心技術與行業應用
本書使用受現實世界商業和行業問題啟發的實際示例來講授強化學習技術的相關知識。本書分為四部分:第一部分涵蓋強化學習的必要背景,包括定義、數學基礎和強化學習解決方案的概述;第二部分深入介紹最先進的強化學習算法(規模化的深度Q-學習、基于策略的方法、基于模型的方法、多智能體強化學習等),包括每種算法的優缺點;第三部分介紹強化學習中的高級技術,包括機器教學、泛化和域隨機化、元強化學習等主題,還涵蓋強化學習中有助于改進模型的各種高級主題;第四部分講解強化學習的各種應用,例如自主系統、供應鏈管理、營銷和金融、智慧城市與網絡安全等,并討論強化學習領域的一些挑戰及未來方向。學完本書,你將掌握如何訓練和部署自己的強化學習智能體來解決強化學習問題。
·19.5萬字