官术网_书友最值得收藏!

統(tǒng)計策略搜索強化學習方法及應用
會員

智能體AlphaGo戰(zhàn)勝人類圍棋專家刷新了人類對人工智能的認識,也使得其核心技術強化學習受到學術界的廣泛關注。本書正是在如此背景下,圍繞作者多年從事強化學習理論及應用的研究內容及國內外關于強化學習的最近動態(tài)等方面展開介紹,是為數(shù)不多的強化學習領域的專業(yè)著作。該著作側重于基于直接策略搜索的強化學習方法,結合了統(tǒng)計學習的諸多方法對相關技術及方法進行分析、改進及應用。本書以一個全新的現(xiàn)代角度描述策略搜索強化學習算法。從不同的強化學習場景出發(fā),講述了強化學習在實際應用中所面臨的諸多難題。針對不同場景,給定具體的策略搜索算法,分析算法中估計量和學習參數(shù)的統(tǒng)計特性,并對算法進行應用實例展示及定量比較。特別地,本書結合強化學習前沿技術將策略搜索算法應用到機器人控制及數(shù)字藝術渲染領域,給人以耳目一新的感覺。最后根據(jù)作者長期研究經(jīng)驗,對強化學習的發(fā)展趨勢進行了簡要介紹和總結。本書取材經(jīng)典、全面,概念清楚,推導嚴密,以期形成一個集基礎理論、算法和應用為一體的完備知識體系。

趙婷婷 ·自動化 ·7.5萬字

QQ閱讀手機版

主站蜘蛛池模板: 台东县| 福清市| 寿宁县| 闸北区| 九龙坡区| 扶余县| 华阴市| 大田县| 徐水县| 桐城市| 八宿县| 开原市| 丽江市| 江都市| 万源市| 上饶县| 枣庄市| 武陟县| 马龙县| 新民市| 通山县| 隆昌县| 海原县| 涞水县| 石嘴山市| 荃湾区| 铁岭市| 东乌| 江油市| 蓝田县| 镇康县| 大连市| 大同市| 金湖县| 财经| 共和县| 天水市| 巴楚县| 泌阳县| 安溪县| 西宁市|