• 商品编码(ISBN)    9787302682417
  • 中图分类号   TP181
  • 开本   32开
  • 页数   0
  • 印刷时间   2025-02-01 00:00:00
  • 印次   1
  • 出次   1
  • 出版时间   2025-03-01 00:00:00
  • 出版社   清华大学出版社
  • 作者   李福林

内容推荐

本书是对强化学习算法的综合性讲解书籍,内容包括主要的强化学习算法的实现思路,以及主要的优化方法的原理。本书介绍的每个算法都分为原理讲解和代码实现两部分,代码实现是为了通过实验验证原理部分的可行性。通过本书的学习,读者可以快速地了解强化学习算法的设计原理,掌握强化学习算法的实现过程,并能研发属于自己的强化学习算法,了解各个算法的优缺点,以及各个算法适用的场景。本书分6篇共18章,基础篇(第1章和第2章)介绍了强化学习中的基本概念。基础算法篇(第3~6章)介绍了QLearning算法、SARSA算法、DQN算法、Reinforce算法。高级算法篇(第7~12章)介绍了AC算法、A2C算法、PPO算法、DDPG算法、TD3算法、SAC算法、模仿学习算法。多智能体篇(第13章和第14章)介绍了在一个系统中存在多智能体时,各个智能体之间的合作、对抗等关系,以及各个智能体之间的通信策略。扩展算法篇(第15~17章)介绍了CQL算法、MPC算法、HER算法。框架篇(第18章)介绍了强化学习框架SB3的使用方法。本书将使用简单浅显的语言,带领读者快速地了解各个主要的强化学习算法的设计思路,以及实现过程。本书适合人工智能方向的初学者阅读,也可作为高等院校相关专业的教材。通过本书各个章节的学习,读者可以掌握主流的强化学习算法的原理和实现方法,并能够既知其然也知其所以然,做到融会贯通。

目录

基础篇
第1章强化学习概述
1.1强化学习的定义
1.2玩耍和学习
1.3对比传统方法
1.4基于表格的直观示例
1.5一般的学习过程
1.6小结
第2章Q函数和时序差分
2.1一个直观的例子
2.2数学描述
2.3准确计算Q函数是困难的
2.4寻求Q函数
2.5小结
基础算法篇
第3章基于表格的强化学习方法
3.1代码运行环境说明
3.2游戏环境
……
内容推荐
目录
普通信息
商品编码(ISBN) 9787302682417
出版时间 2025-03-01 00:00:00
出版社 清华大学出版社
作者 李福林
中图分类号 TP181
开本 32开
页数 0
印刷时间 2025-02-01 00:00:00
印次 1
出次 1
该商品还没有评价~
我的足迹
您暂未有浏览记录~
站长统计