強化學習:原理與Python實現
全書分為三個部分。第一部分了解強化學習應用,了解強化學習基本知識,搭建強化學習測試環境。該部分包括:強化學習的概況、強化學習簡單示例、強化學習算法的常見思想、強化學習的應用、強化學習測試環境的搭建。第二部分介紹強化學習理論與深度強化學習算法。強化學習理論部分:Markov決策過程的數學描述、MonteCarlo方法和時序差分方法的數學理論;深度強化學習算法部分:詳細剖析全部具有重要影響力的深度強化學習算法,結合TensorFlow實現源碼。第三部分介紹強化學習綜合應用案例。
·12.2萬字