论文部分内容阅读
得益于深度学习强大的特征表达能力和强化学习有效的策略学习能力,深度强化学习在一系列复杂序贯决策问题中取得了令人瞩目的成就.伴随着深度强化学习在诸多单智能体任务中的成功应用,其在多智能体系统中的研究方兴未艾.近年来,多智能体深度强化学习在人工智能领域备受关注,可扩展与可迁移性已成为其中的核心研究点之一.首先阐释了深度强化学习的发展脉络和典型算法;进而介绍了多智能体深度强化学习的三种学习范式,分析了两类多智能体强化学习的典型算法,即分解值函数方法和中心化值函数方法;归纳了注意力机制、图神经网络等六类具有可扩展性的多智能体深度强化学习模型,梳理了迁移学习和课程学习在多智能体深度强化学习可迁移性方向的研究进展;最后讨论了多智能体深度强化学习的应用前景与研究方向,为未来多智能体深度强化学习的进一步发展提供了可借鉴的参考.