ISBN/ISSN:978-7-111-61288-9
出版:北京 :机械工业出版社 ,2019
载体形态:11,203页 :图 ;24cm
附注:机器学习系列
简介:强化学习是一种重要的机器学习方法,在智能体及分析预测等领域有许多应用。本书共13章,主要包括强化学习的各种要素,即智能体、环境、策略和模型以及相应平台和库;Anaconda、Docker、OpenAI Gym、Universe和TensorFlow等安装配置;马尔可夫链和马尔可夫过程及其与强化学习问题建模之间的关系,动态规划的基本概念;蒙特卡罗方法以及不同类型的蒙特卡罗预测和控制方法;时间差分学习、预测、离线/在线策略控制等;多臂赌博机问题以及相关的各种探索策略方法;深度学习的各种基本概念和RNN、LSTM、CNN等神经网络;深度强化学习算法DQN,以及双DQN和对抗网络体系结构等改进架构;DRQN以及DARQN;A3C网络的基本工作原理及架构;策略梯度和优化问题;最后介绍了强化学习的最新进展以及未来发展。
并列题名:Hands-on reinforcement learning with Python :master reinforcement and deep reinforcement learning using OpenAl Gym and TensorFlow
其他题名:应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习
中图分类号:TP311.561 TP312PY
责任者:拉维尚迪兰 著 连晓峰 译
豆瓣内容简介:
豆瓣作者简介:
分馆名 | 馆藏部门 | 图书条码 | 索书号 | 登录号 | 卷期 | 状态 | 异地预借 |
A | (5楼)科技图书阅览室 | A0477718 | TP311.561/327 | A0477718 | 在架可借 | 异地预借 |
序号 | 图书条码 | 索书号 | 登录号 | 藏书部门 | 流通状态 | 年卷期 | 装订册 | 装订方式 | 装订颜色 |
类型 | 说明 | URL |
评 论 |
北京创讯未来软件技术有限公司 版权所有 ALL RIGHTS RESERVED 京ICP备 09032139
欢迎第5690540位用户访问本系统