基于群落学习的空中博弈对抗模型

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:tomb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,许多强化学习模型取得了令人满意的成绩.然而,其大多数还要求有较大量的对战训练数据,否则很容易产生模型冷启动、过拟合等一系列问题.针对这些问题,该文针对空战环境,提出了一种更为稳定有效的空战环境下行动策略设计.在融合自注意力机制的同时改进了群落学习(Population-based Learning,PBT)在现有强化学习模型训练中的应用.本文设计模型PSA-Air(Population-based Self-attention Air Combat Model),在尚未结束的2021首届全国空中智能博弈对抗大赛中取得了优秀的成绩.经实验证明,本文算法设计在收敛速度以及最终性能上具有一定的优越性.
其他文献
在瞬息万变的信息时代,随着计算机技术的不断发展,云计算已成为推动社会生产力变革的重要力量.Docker是一种开源的容器级虚拟化技术,基于它可以建立基础设施即服务(IaaS)云服务,Docker生成的虚拟主机与传统虚拟化主机相比,更加轻量化.Docker对于推动高校信息化建设具有重要的意义,因此结合Docker技术为高校私有云平台的建设提供了有效的解决方案.