【摘 要】
:
鉴于多智能体深度强化学习在解决蜂群系统、能源分配和大型团队策略游戏等高维复杂动作空间以及多智能体决策问题中的良好表现,提出了一种基于多智能体深度强化学习的空战博
【机 构】
:
解放军31102部队南京210000,陆军工程大学指挥控制工程学院南京210007,中国电子科技集团公司第二十八研究所南京210007,陆军边海防学院西安710100
【基金项目】
:
国家自然科学基金(61806221),国防科技创新特区163计划(1916311LZ00100301),装备发展部“十三五”预研课题(31505550302),国防科技重点实验室基金(6142101180304)资助项目。
论文部分内容阅读
鉴于多智能体深度强化学习在解决蜂群系统、能源分配和大型团队策略游戏等高维复杂动作空间以及多智能体决策问题中的良好表现,提出了一种基于多智能体深度强化学习的空战博弈对抗策略训练模型。在对多智能体深度强化学习基本概念和对空战策略生成的可行性分析的基础上,建立了基于多智能体马尔可夫决策过程空战配合策略的框架,从而生成最优对抗策略。实践表明,该模型可生成多种双机联合对抗策略,具有较高的研究价值和实际意义。
其他文献
以D-异抗坏血酸钠、乳酸链球菌素、双乙酸钠为防腐剂,添加到大蒜原汁中,对大蒜原汁保鲜技术进行了探讨。通过单因素实验和正交实验确定了复合防腐剂的最佳配方:0.20%D-异抗坏
根据2018年水利部、发展改革委等国家四部委印发的《关于开展长江经济带小水电清理整改工作的意见》,狠抓小水电清理整改与绿色改造。针对江西省的实际情况,近期以不低于河道
提高园林绿化的施工质量,要从土壤的改良,苗木的选择、处理和运输,土地的平整,苗木的栽植前处理,苗木的栽植入手,科学合理地完善施工过程,提高植物成活率。本文将结合实际,谈
以聚乙二醇(PEG)为有机相变成分,通过CuSO4和硫脲的混合溶液对氧化石墨烯(GO)进行交联改性,Cu 2+交联氧化石墨烯(GO)而且引入硫脲对GO表面的羧基进行酰胺化改性,得到GO-CuSO4
基于将军庙枢纽工程的整体规划与布置、混凝土面板砂砾石坝坝基处理措施、筑坝材料特性等,建立了混凝土面板砂砾石坝的三维数值计算模型,通过计算分析竣工期和蓄水期坝体的受
使用依据总有机碳谱仪能够快速准确地测量重水中的无机碳(IC)和总碳(TC),总有机碳(TOC)=总碳(TC)-无机碳(IC)可计算出重水中有机碳含量。该方法线性系数能达到0.999,回收率也能达到102.7%~116.0%,仪器检出限分别是:无机碳0.27μg/L和总碳0.53μg/L,能够满足重水中有机碳含量分析要求。
基于官地水电站表孔闸门在动水启落门过程中出现偏差过大报警的现象,对闸门开度传感器的工作特性、传感器安装位置的测量数据分析,认为是左缸开度传感器与活塞杆之间的安装间
中国长江三峡集团有限公司(以下简称中国三峡集团),经国务院批准于1993年9月成立,总部位于北京,是全球最大的水电开发企业,中国最大的清洁能源集团,入选首批创建世界一流示范
实验以钾长石、碳酸钡、高岭土、滑石、Fe2O3、CoO、Cr2O3为原料制备无光黑釉,研究了着色剂Fe2O3、CoO、Cr2O3含量在钡质无光釉中的显色效果。结果表明:配方组成为钾长石53wt
深埋巷道处于高地应力区,在爆破开挖过程中卸荷强烈,极易诱发岩爆等动力灾害。在岩体内部和表面埋设振动传感器,监测研究深埋巷道的转弯段爆破开挖过程振动信号传播及影响,以