- 深度強化學習實踐(原書第2版)
- (俄)馬克西姆·拉潘
- 134字
- 2021-08-18 17:39:17
1.5 總結
本章介紹了為什么RL很特殊以及它與監督學習和非監督學習之間的關系。然后介紹了RL的基本形式以及它們之間如何交互,之后介紹了MP、馬爾可夫獎勵過程以及MDP。這些知識將成為本書其余部分的基礎。
下一章將從理論過渡到RL實踐,包含了環境設置以及庫的介紹,然后教你寫下第一個智能體。
推薦閱讀
- Python元學習:通用人工智能的實現
- 決策智能:鏈接數據、行為和結果的新智能
- 21世紀機器人
- 秒懂AI編程:零基礎搞定辦公自動化
- 玩轉ChatGPT:秒變AI提問和追問高手
- 機器學習實戰:基于Scikit-Learn、Keras和TensorFlow(原書第3版)
- DeepSeek實戰:操作攻略與商業應用
- 創造性思維:人工智能之父馬文·明斯基論教育
- 解碼智能時代2021:前沿趨勢10人談
- 塊數據4.0:人工智能時代的激活數據學
- 機器人智能視覺感知與深度學習應用
- 大模型項目實戰:Agent開發與應用
- 人人都是設計師:設計基礎+Midjourney+ChatGPT
- 推薦系統技術原理與實踐
- 大型語言模型實戰指南:應用實踐與場景落地