11.3 REINFORCE的問題
- 深度強化學(xué)習(xí)實踐(原書第2版)
- (俄)馬克西姆·拉潘
- 1592字
- 2021-08-18 17:39:44
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 移動平臺深度神經(jīng)網(wǎng)絡(luò)實戰(zhàn):原理、架構(gòu)與優(yōu)化
- 這就是推薦系統(tǒng):核心技術(shù)原理與企業(yè)應(yīng)用
- 聯(lián)邦學(xué)習(xí)實戰(zhàn)
- 機器人系統(tǒng)設(shè)計及應(yīng)用
- 人工智能不會做什么:100億人類與100億機器人共存的未來
- 玩轉(zhuǎn)ChatGPT:秒變AI論文寫作高手
- 機器人智能視覺感知與深度學(xué)習(xí)應(yīng)用
- AIGC原理與實踐:零基礎(chǔ)學(xué)大語言模型、擴散模型和多模態(tài)模型
- 人工智能算法(卷3):深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)
- 人工智能
- 與機器人共舞
- 深度學(xué)習(xí)視頻理解
- VR簡史:一本書讀懂虛擬現(xiàn)實
- TensorFlow機器學(xué)習(xí)
- 智能體設(shè)計指南:成為提示詞高手和AI Agent設(shè)計師