智能控制與強化學習:先進值迭代評判設計
在人工智能技術的大力驅動下,智能控制與強化學習發展迅猛,先進自動化設計與控制日新月異。本書針對復雜離散時間系統的優化調節、最優跟蹤、零和博弈等問題,以實現穩定學習、演化學習和快速學習為目標,建立一套先進的值迭代評判學習控制理論與設計方法。首先,對先進值迭代框架下迭代策略的穩定性進行全面深入的分析,建立一系列適用于不同場景的穩定性判據,從理論層面揭示值迭代算法能夠實現離線最優控制和在線演化控制。其次,基于迭代歷史信息,提出一種新穎的收斂速度可調節的值迭代算法,有助于加快學習速度、減少計算代價,更高效地獲得非線性系統的最優控制律。結合人工智能技術,對無模型值迭代評判學習控制的發展前景也進行了討論。本書內容豐富、結構清晰、由淺入深、分析透徹,既可作為智能控制、強化學習、優化控制、計算智能、自適應與學習系統等領域研究人員和學生的參考書,又可供相關領域的技術人員使用。
·8.7萬字