博文

多智能体深度强化学习的若干关键科学问题

已有 5619 次阅读 2020-7-21 17:47 |系统分类:博客资讯

伴随计算和存储能力的大幅提升，深度学习在人工智能领域获得了巨大的成功。在此背景下，产生了由深度学习和强化学习结合的深度强化学习。

本文综述了强化学习和深度强化学习方法的原理，分析了多智能体深度强化学习中存在的若干重要问题和解决方法，提供多智能体深度强化学习未来的研究方向，为开发更强大、更易应用的多智能体强化学习控制系统提供一些思路。

深度强化学习

深度强化学习将深度学习技术和强化学习方法结合到一起。利用深度学习感知环境特征，利用强化学习方法求取最优策略。现阶段，深度强化学习已在围棋、游戏、导航、移动控制等领域实现突破性进展。

多智能体深度强化学习的若干关键科学问题.jpg

深度强化学习原理图

多智能体深度强化学习

多智能体深度强化学习问题是复杂的、动态的，给学习决策过程带来很大困难。本文提出学习系统的闭环控制框架，分析了多智能体深度强化学习的算法结构、环境非静态、部分可观性、基于学习的通信、算法收敛性和稳定性等问题，并且对所调查方法的优缺点和相关应用进行分析和讨论。

学习系统闭环控制框架

研究成果的意义

深度强化学习在无人驾驶、机器人控制、交通运输调度、电力系统优化、分布式传感网络以及金融和社会学等领域还有大量的应用研究。更为重要的是, 深度强化学习可能成为一种解决复杂问题的有效方法, 极大地推动人工智能和自动化技术的发展。

引用格式：孙长银, 穆朝絮. 多智能体深度强化学习的若干关键科学问题. 自动化学报, 2020, 46(7): 1301−1312

链接：http://www.aas.net.cn/cn/article/id/41ddf9f1-8977-45c9-b63b-e62e8f18059f

作者简介

孙长银东南大学自动化学院教授，主要研究方向为智能控制与优化，强化学习, 神经网络, 数据驱动控制。

E-mail: cysun@seu.edu.cn

穆朝絮天津大学电气自动化与信息工程学院教授. 主要研究方向为强化学习, 自适应学习系统, 非线性控制和优化。

E-mail: cxmu@tju.edu.cn

转载本文请联系原作者获取授权，同时请注明本文来自欧彦科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3291369-1243004.html

上一篇：直播预告‖自动化学报&JAS线上讲堂之第六讲
下一篇：一种学习稀疏BN最优结构的改进K均值分块学习算法

收藏 IP: 159.226.182.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

欧彦

扫一扫，分享此博文

全部作者的精选博文

• 2023年度自动化领域国家自然科学基金申请与资助情况

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

多智能体深度强化学习的若干关键科学问题

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

多智能体深度强化学习的若干关键科学问题

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)