策略前展、策略迭代与分布式强化学习

作者: [美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)

ISBN号: 9787302599388

出版日期: 2022-04-01

定价: ¥139

咨询QQ:2301891038(仅限教师)
内容简介

本书目的是从作者最近出版的《强化学习预最优控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。 本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书,也可供信息、通信、控制、优化等领域的科研人员参考。

更多图书信息
  • 策划编辑:王一玲
  • 出版日期:2022-04-01
  • 作者:[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
  • 书号:9787302599388
  • 印刷日期:2022-03-11

作者信息

[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)

同系列图书 更多>