官术网_书友最值得收藏!

<menuitem id="fbibe"><center id="fbibe"></center></menuitem>

<samp id="fbibe"><ins id="fbibe"></ins></samp>

<dfn id="fbibe"><center id="fbibe"><em id="fbibe"></em></center></dfn>

<samp id="fbibe"></samp>

書名：深度強化學習實踐（原書第2版）
作者名： (俄)馬克西姆·拉潘
本章字數： 157字
更新時間： 2021-08-18 17:39:19

2.6　總結

本章已經開始介紹RL的實踐部分了！在本章中，我們安裝了OpenAI Gym，它能提供大量的環境。本章研究了它的基礎API，創建了一個行為隨機的智能體。

還介紹了如何以模塊化的方式擴展現存環境的功能，介紹了如何使用Monitor類錄制智能體的活動。后面的章節會大量使用這些技巧。

下一章將使用PyTorch快速回顧DL，PyTorch是DL研究人員最喜歡用的一個庫，敬請期待！

主站蜘蛛池模板：玛曲县| 江永县| 龙井市| 略阳县| 格尔木市| 南京市| 故城县| 横山县| 康马县| 黑龙江省| 宜州市| 潜江市| 长子县| 永胜县| 甘德县| 郴州市| 紫金县| 白城市| 波密县| 岐山县| 望城县| 井陉县| 石嘴山市| 保德县| 屯留县| 阳朔县| 唐海县| 乌什县| 遵义县| 宜州市| 长春市| 南川市| 酒泉市| 黔东| 砀山县| 仁寿县| 墨竹工卡县| 吉水县| 穆棱市| 江山市| 定安县|

<menuitem id="gwu46"></menuitem>

<samp id="gwu46"><ins id="gwu46"></ins></samp>

<td id="gwu46"><dl id="gwu46"><label id="gwu46"></label></dl></td>

<span id="gwu46"><dl id="gwu46"></dl></span>

<dfn id="gwu46"></dfn>

<td id="gwu46"><rt id="gwu46"><label id="gwu46"></label></rt></td>

<strike id="gwu46"><rt id="gwu46"><thead id="gwu46"></thead></rt></strike>

<strike id="gwu46"><i id="gwu46"><pre id="gwu46"></pre></i></strike><td id="gwu46"></td>

<dfn id="gwu46"></dfn>