基于强化学习的多无人机避碰计算制导方法

来源 :导航定位与授时 | 被引量 : 0次 | 上传用户：bluelpower

【摘要】

：

针对大量固定翼无人机在有限空域内的协同避碰问题,提出了一种基于多智能体深度强化学习的计算制导方法。首先,将避碰制导过程抽象为序列决策问题,通过马尔可夫博弈理论对其进行数学描述。然后提出了一种基于深度神经网络技术的自主避碰制导决策方法,该网络使用改进的Actor-Critic模型进行训练,设计了实现该方法的机器学习架构,并给出了相关神经网络结构和机间协调机制。最后建立了一个实体数量可变的飞行场景模拟

【作者】

：

赵毓郭继峰郑红星白成超

【机构】

：

哈尔滨工业大学航天学院

【出处】

：

导航定位与授时

【发表日期】

：

2021年01期

【关键词】

：

多智能体强化学习计算制导固定翼避碰 Multi-agent Reinforcement learning Computational guidance

【基金项目】

：

国家自然科学基金(61973101),航空科学基金(20180577005)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

关于发展证券市场的点滴思考

期刊

证券市场现代市场经济资金拆借市场股份公司股票市场融资渠道股份制改造内幕交易不良因素证券化

信息技术背景下的小学语文阅读教学

在现如今的语文教学中,课外阅读占有重要的地位。部编版小学语文教材中的“快乐读书吧”板块将课外阅读课程化,引导学生进行大量的阅读实践,以促进学生阅读能力的提升。教材

期刊

课外阅读《格林童话》导读信息融合

2006-2018年汾河流域土地生态安全预警测度及时空格局演变

[目的]开展汾河流域土地生态安全预警研究,为流域土地资源科学合理利用及可持续发展提供参考。[方法]采用乘算模型、空间自相关及地理探测器方法分析2006-2018年流域土地生态

期刊

土地生态安全预警空间自相关地理探测器时空格局汾河流域early warning of land ecological securityspatial

Application of Neural network PID Controller in Constant Temperature and Constant Liquid-level Syst

Guided by the principle of neural network, an intelligent PID controller based on neural network is devised and applied to control of constant temperature and c

期刊

PID控制器神经网络PID控制恒温恒液位系统

我国城市发展现状与展望

经历了改革开放以来大规模、高速度、集中化的城市化建设之后,我国已基本实现了从"乡土中国"向"城市中国"的重大转型。城市规模在调整变化中快速增长,为城市化提供了广阔腹地

期刊

城市化城市现代化城市群

大众工控15″高亮度平板电脑展示给您真正的清晰画面

期刊

平板电脑ATP-150E产品特性产品规格清晰度

LM331在温度测控中的应用

LM331是一种精密频率电压转换器.非常适用于用作模/数转换器.文中介绍了LM331的主要性能指标,同时给出了其与单片机8098的接口.

期刊