統計策略搜索強化學習方法及應用
智能體AlphaGo戰勝人類圍棋專家刷新了人類對人工智能的認識,也使得其核心技術強化學習受到學術界的廣泛關注。本書正是在如此背景下,圍繞作者多年從事強化學習理論及應用的研究內容及國內外關于強化學習的最近動態等方面展開介紹,是為數不多的強化學習領域的專業著作。該著作側重于基于直接策略搜索的強化學習方法,結合了統計學習的諸多方法對相關技術及方法進行分析、改進及應用。本書以一個全新的現代角度描述策略搜索強化學習算法。從不同的強化學習場景出發,講述了強化學習在實際應用中所面臨的諸多難題。針對不同場景,給定具體的策略搜索算法,分析算法中估計量和學習參數的統計特性,并對算法進行應用實例展示及定量比較。特別地,本書結合強化學習前沿技術將策略搜索算法應用到機器人控制及數字藝術渲染領域,給人以耳目一新的感覺。最后根據作者長期研究經驗,對強化學習的發展趨勢進行了簡要介紹和總結。本書取材經典、全面,概念清楚,推導嚴密,以期形成一個集基礎理論、算法和應用為一體的完備知識體系。
·7.5萬字