SC2LE场景下基于QMIX算法的多智能体协同控制

来源 :指挥信息系统与技术 | 被引量 : 0次 | 上传用户:kim5618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决多智能体协同控制中高维状态空间与环境部分可观测的问题,研究了中心式训练分布式执行框架在多智能体强化学习中的实现方法,以及复杂场景下传统强化学习算法,并采用带注意力机制的QMIX算法实现了协同控制。以星际争霸2学习环境(SC2LE)为基础的小场景中,将多个作战单位作为多智能体进行协同控制并加以试验验证。试验结果表明,与其他多智能体强化学习算法相比,带注意力机制的QMIX算法能够得到收敛的训练模型,可获得较好的协同控制效果。
其他文献
在上世纪末,含氮原子的杂环配体在催化一系列的不对称环丙烷化反应中已经得到了广泛的应用,此外具有联苯、联萘以及双核二茂铁类的含氮杂环金属配合物也普遍应用在不对称环丙
水轮发电机组振动原因复杂,相对于水平振动而言,机组的垂直振动破坏性更大、原因更复杂。通过对某水电厂机组垂直振动的分析,排除了机械振动、电磁振动,对水力振动的分析与验
大坝监测数据分析是大坝安全监测的重要环节,是认识大坝规律和判断大坝安全的重要手段。运用多重分形去趋势波动分析理论研究大坝位移时间序列的多重分形特性、大坝位移波动
目的:探讨西宁市北郊四季大气PM2.5中多环芳烃(PAHs)污染物含量及时间分布状况,为治理西宁市北郊大气污染状况提供一定的科学参考。方法:2018年于青海大学化工学院为采样点,
当今世界,信息和网络技术的高速发展把人类社会带入了信息化时代,网络也日益改变现代人的学习、工作和生活方式,同时对传统观念和运作方式产生了巨大的影响.目前,青少年是上
在水电站地下洞室群的施工及长期运行中,地下渗流排水孔会因渗流结晶等各种因素导致堵塞失效。基于排水孔模拟的隐式复合单元法,提出非稳定渗流情况下排水措施的模拟方法,结
针对某水电站机组技术供水系统蜗壳取水口拦污栅历次堵塞而换型的原因分析,通过设计与试验,历时三个检修周期,最终探索了一种改型立体板式结构拦污栅,能够有效减轻拦污栅严重
国外某水电站引水隧洞工程区域地质条件复杂,裂隙及断层发育,确定其线路及洞径是设计的重点及难点。基于该工程的基本地质条件,针对输水流量、覆盖层厚度、围岩稳定、施工条
三峡工程是治理、开发和保护长江的关键性骨干工程,是迄今世界上规模最大的水利水电工程,主要由枢纽工程、移民工程及输变电工程三大部分组成,具有防洪、发电、航运、水资源
运行中的汽轮机油应有良好的抗乳化性。选取某电厂破乳化时间不合格的运行油样与同牌号的新油按不同的体积比进行混合,测定混合油的破乳化时间,以找到使运行油破乳化时间降至