基于群落学习的空中博弈对抗模型

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户：tomb

【摘要】

：

近年来,许多强化学习模型取得了令人满意的成绩.然而,其大多数还要求有较大量的对战训练数据,否则很容易产生模型冷启动、过拟合等一系列问题.针对这些问题,该文针对空战环境,提出了一种更为稳定有效的空战环境下行动策略设计.在融合自注意力机制的同时改进了群落学习(Population-based Learning,PBT)在现有强化学习模型训练中的应用.本文设计模型PSA-Air(Population-based Self-attention Air Combat Model),在尚未结束的2021首届全国空中智

【作者】

：

沈贤杰

【机构】

：

中国电子科技南湖研究院JS大脑实验室,杭州314000

【出处】

：

智能计算机与应用

【发表日期】

：

2022年2期

【关键词】

：

强化学习自注意力机制群落学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于Docker的高校私有云平台建设研究

在瞬息万变的信息时代,随着计算机技术的不断发展,云计算已成为推动社会生产力变革的重要力量.Docker是一种开源的容器级虚拟化技术,基于它可以建立基础设施即服务(IaaS)云服务,Docker生成的虚拟主机与传统虚拟化主机相比,更加轻量化.Docker对于推动高校信息化建设具有重要的意义,因此结合Docker技术为高校私有云平台的建设提供了有效的解决方案.

期刊

云计算Docker技术虚拟化技术私有云平台教育云

基于群落学习的空中博弈对抗模型

与本文相关的学术论文