水木书荟

阿尔法零对最优模型预测自适应控制的启示

作者： [美]德梅萃·P. 博塞克斯（Dimitri P. Bertsekas）、

ISBN号： 9787302684718

出版日期： 2025-04-01

印次：1-1

定价：￥79

资源下载

咨询QQ：2301891038（仅限教师）

内容简介

第一章，从阿尔法零的卓越性能出发，深入解读其背后着实不易的成长历程，揭示其数学模型。第二章，从确定性和随机动态规划问题入手，介绍决策问题的数学模型。第三章，从抽象视角回顾纷繁复杂的强化学习算法，揭示值函数近似与滚动改进的重要作用。第四章，从经典的线性二次型最优控制问题入手，分析从阿尔法零的成功中学到的经验。第五章，分别从鲁棒、自适应、模型预测控制等问题入手，分析值函数近似与滚动改进对算法性能的提升潜力。第六章，从离散优化的视角审视阿尔法零的成功经验。第七章，总结全书。适合作为本领域研究者作为学术专著阅读，也适合作为研究生和本科生作为参考书使用。

更多图书信息

策划编辑：古雪
出版日期：2025-04-01
作者：[美]德梅萃·P. 博塞克斯（Dimitri P. Bertsekas）
书号：9787302684718
印刷日期：2025-03-31
印次：1-1

作者信息

[美]德梅萃·P. 博塞克斯（Dimitri P. Bertsekas）、

同系列图书更多>

策略前展、策略迭代与分布式强化学习

[美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著

￥139.00
抽象动态规划（第2版）

[美]德梅萃·P.博赛卡斯（Dimitri P. Bertsekas）著

￥89.00
强化学习与最优控制

[美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著

￥149.00
线性控制系统分析与设计（第四版）

［美］John J. D.

￥79.00

阿尔法零对最优模型预测自适应控制的启示

作者信息

同系列图书 更多>

策略前展、策略迭代与分布式强化学习

抽象动态规划（第2版）

强化学习与最优控制

线性控制系统分析与设计（第四版）

同系列图书更多>