基于强化学习的多无人机避碰计算制导方法

来源 :导航定位与授时 | 被引量 : 0次 | 上传用户:bluelpower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大量固定翼无人机在有限空域内的协同避碰问题,提出了一种基于多智能体深度强化学习的计算制导方法。首先,将避碰制导过程抽象为序列决策问题,通过马尔可夫博弈理论对其进行数学描述。然后提出了一种基于深度神经网络技术的自主避碰制导决策方法,该网络使用改进的Actor-Critic模型进行训练,设计了实现该方法的机器学习架构,并给出了相关神经网络结构和机间协调机制。最后建立了一个实体数量可变的飞行场景模拟器,在其中进行"集中训练"和"分布执行"。为了验证算法的性能,在高航路密度场景中进行了仿真实验。仿真结果
其他文献
在现如今的语文教学中,课外阅读占有重要的地位。部编版小学语文教材中的“快乐读书吧”板块将课外阅读课程化,引导学生进行大量的阅读实践,以促进学生阅读能力的提升。教材
[目的]开展汾河流域土地生态安全预警研究,为流域土地资源科学合理利用及可持续发展提供参考。[方法]采用乘算模型、空间自相关及地理探测器方法分析2006-2018年流域土地生态
Guided by the principle of neural network, an intelligent PID controller based on neural network is devised and applied to control of constant temperature and c
经历了改革开放以来大规模、高速度、集中化的城市化建设之后,我国已基本实现了从"乡土中国"向"城市中国"的重大转型。城市规模在调整变化中快速增长,为城市化提供了广阔腹地
LM331是一种精密频率电压转换器.非常适用于用作模/数转换器.文中介绍了LM331的主要性能指标,同时给出了其与单片机8098的接口.
为了提高器件抗干扰和易于集成的能力,提出了两款基于平面倒F天线的新型低剖面差分滤波天线。首先基于开口环谐振器设计了一款差分带通滤波器,然后分别通过直角和斜角形式的
目的:探讨层级护理管理模式在ICU护理管理中的应用价值。方法:在笔者所在医院2014年4月-2017年4月ICU收治的患者中随机选取80例,随机分成两组。观察组(40例),对该组实施层级护理
3月5日下午,第二十三届上海集邮节启动仪式在邮政大楼新五楼会场举行。中国邮政集团有限公司上海市分公司副总经理黄来芳;上海市集邮协会会长毕晓哉,副会长丁劲松、张长东、