基于多智能体强化学习的多机器人协作策略研究

来源 :系统工程理论与实践 | 被引量 : 0次 | 上传用户:fso2084
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了一种基于智能体动作预测的多智能体强化学习算法.在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法.此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作.
其他文献
长久以来,在欧洲的艺术长河中,西欧的绘画艺术是更受人们重视的,而对东欧的绘画艺术关注较少,但东欧诸国的艺术也具有独特的魅力,作品丰富多彩,值得研究。东欧诸国大多长期遭
超分子化学(supramolecular chemistry),是研究两种或多种化学物质通过非共价键作用力相互作用而形成更复杂的有机整体的科学。超分子聚合物(supramolecular polymers)是超分
Q&A对话魏学峰rn“离开了艺术,生命是不会开花的”rn文坛巨匠巴金曾为魏学峰题字:离开了艺术,生命是不会开花的.rn仅出生72天就不幸患上小儿麻痹症,在外人来看,身体残疾也就
期刊
过渡金属钯催化的反应在近几十年内得到了很大地发展,是合成有机天然分子以及各类药物分子非常有效的合成方法之一,同时也是有机合成中的一个重要研究领域。钯催化的C-H键官能
层状村料因其独特的结构及内电子场效应能有效促进光生电子与空穴的产生和转移而备受关注,特别是Bi(Ⅲ) 5d106s2可以与O-2p轨道杂化使材料的吸收光范围向可见光区扩展。据我
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文通过对荣华二采区10
期刊
中共中央总书记、国家主席、中央军委主席江泽民最近在山西考察党建工作时指出,党的作风是党的形象,是党的性质、宗旨、纲领、路线的重要体现,是党的创造力、战斗力和凝聚力的重
碳氟表面活性剂由于高电负性、大体积的氟原子的引入而具有较其相应碳氢表面活性剂独特的疏水、疏油性,表现出强的热稳定性、化学、生物稳定性、超高的气体解能力、高的表面活
我们总是会在不同的地方与这幅画或是这幅画的变异版不期而遇,这幅画甚至可以入选人们最耳熟能详的西方油画之一。但是,似乎有那么几个问题,始终困扰着人们却又不好意思问出口,比如:自由女神为什么一定要露胸?她身边的男子为什么不穿裤子?恰巧这两个问题正是理解这幅作品的关键。由于这是一幅涉及时事的作品,要想找到答案,不妨先简单了解一下当时的历史。    波旁王朝的专制统治令经历过法国大革命的法国人民难以忍受,