《强化学习》一书内容系统全面,覆盖面广,既有理论阐述、公式推导,又有丰富的典型案例,理论联系实际。书中全面系统地描述了强化学习的起源、背景和分类,各类强化学习算法的原理、实现方式以及各算法间的关系,为读者构建了一个完整的强化学习知识体系;同时包含丰富的经典案例,如各类迷宫寻宝、飞翔小鸟、扑克牌、小车爬山、倒立摆、钟摆、多臂赌博机、五子棋、AlphaGo、AlphaGo Zero、AlphaZero等,通过给出它们对应的详细案例说明和代码描述,让读者深度理解各类强化学习算法的精髓。《强化学习》案例生动形象,描述深入浅出,代码简洁易懂,注释详细。 《强化学习》可作为高等院校计算机、自动化及相关专业的本科生或研究生教材,也可供对强化学习感兴趣的研究人员和工程技术人员阅读参考。
[英] 马修·穆卡姆(Matthew Moocarme) [英]玛拉·阿伯杜拉乃德(Mahla Abdolahnejad) [英] 瑞提什·巴格瓦特(Ritesh Bhagwat)著,邹伟 张良谋 刘亚明 译
[英]斯沃纳·古普塔(Swarna Gupta) [英]雷汉·阿里·安萨里(Rehan Ali Ansari) [英]迪帕扬·萨卡尔(Dipayan Sarkar)著,毛国君 林江宏 译