作者: [美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)、
ISBN号: 9787302540328
出版日期: 2020-06-01
印次:1版-1
定价: ¥149
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于最优控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁。
[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)、
[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas)
[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
[美]德梅萃·P.博赛卡斯(Dimitri P. Bertsekas) 著
[美]John J. D.