阿尔法零对最优模型预测自适应控制的启示

作者: [美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas)

ISBN号: 9787302684718

出版日期: 2025-04-01

印次:1-1

定价: ¥79

咨询QQ:2301891038(仅限教师)
内容简介

第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的成功中学到的经验。第五章,分别从鲁棒、自适应、模型预测控制等问题入手,分析值函数近似与滚动改进对算法性能的提升潜力。第六章,从离散优化的视角审视阿尔法零的成功经验。第七章,总结全书。适合作为本领域研究者作为学术专著阅读,也适合作为研究生和本科生作为参考书使用。

更多图书信息
  • 策划编辑:古雪
  • 出版日期:2025-04-01
  • 作者:[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas)
  • 书号:9787302684718
  • 印刷日期:2025-03-31
  • 印次:1-1

作者信息

[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas)

同系列图书 更多>