決策算法
本書源于斯坦福大學的相關課程,主要介紹不確定狀態下的決策算法,涵蓋基本的數學問題和求解算法。本書共分為五個部分:首先解決在單個時間點上簡單決策的不確定性和目標的推理問題;然后介紹隨機環境中的序列決策問題;接著討論模型不確定性,包括基于模型的方法和無模型的方法;之后討論狀態不確定性,包括精確信念狀態規劃、離線信念狀態規劃、在線信念狀態規劃等;最后討論多智能體系統,涉及多智能體推理和協作智能體等。本書主要關注規劃和強化學習,其中一些技術涉及監督學習和優化。書中的算法是用Julia編程語言實現的,并配有大量圖表、示例和練習題。本書要求讀者具備扎實的數學基礎,適合計算機科學、數學、統計學、電氣工程、航空航天等領域的讀者閱讀。
·25.7萬字