基于深度强化学习的弹道导弹中段突防控制

来源 :指挥信息系统与技术 | 被引量 : 0次 | 上传用户：yizhonglishi

【摘要】

：

提出了一种基于Markov决策过程的弹道导弹中段突防控制模型,并基于状态-动作对值函数建立了一种完全数据驱动的控制模型。为了加快深度神经网络的收敛速度、增强训练过程中的

【作者】

：

南英蒋亮

【机构】

：

南京航空航天大学航天学院

【出处】

：

指挥信息系统与技术

【发表日期】

：

2020年4期

【关键词】

：

弹道导弹深度强化学习中段突防策略人工智能 ballistic missiledeep reinforcement learningmidcourse p

【基金项目】

：

国防重点实验室开放基金(61425010102)资助项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种基于Markov决策过程的弹道导弹中段突防控制模型,并基于状态-动作对值函数建立了一种完全数据驱动的控制模型。为了加快深度神经网络的收敛速度、增强训练过程中的稳定性,引入了竞争架构和目标网络架构,设计了一种深度神经网络架构竞争双深度Q网络(D3Q)。对传统深度Q网络(DQN)的强化学习算法中的记忆池生成方法进行了改进,提升了训练样本质量。训练及验证结果表明,该方法实现了D3Q网络对弹道导弹中段突防最优控制模型的逼近。

其他文献

莆田市发展农机化的探讨

结合当前莆田市农业机械化发展概况，分析了农机化发展未跟上现代农业发展步伐的主要原因，从加大政府的支农力度、加强与省农机科研单位或大学院校的联系、搞好服务、加强监管，确

期刊

农业机械化农机化莆田市

基于知识图谱的实体标签可视化

针对实体理解中实体识别问题,传统的实体标签方法致力于在不同实体中找到其独特特征。为了便于理解知识图谱(KG)中每个实体的区分性,提出了一种基于KG的实体标签方法来识别出

期刊

知识图谱实体标签可视化表示学习knowledge graph(KG)entity labeling visualizationrepresentation

高含硫天然气集输管道硫沉积预测方法研究

随着世界各国对能源需求的不断增长,开发高含硫气田有助于缓解能源紧张的局面,其在整个天然气工业中的地位也将越来越突出。与常规天然气相比,高含硫天然气不仅具有极强的腐

学位

高含硫天然气集输管道硫沉积预测方法

哈代“性格与环境小说”中的进化向善思想研究

托马斯·哈代是英国维多利亚时期著名的小说家,他因创作了多部卓尔不群的著作而被称为小说界的莎士比亚。哈代一生经历了两个世纪的更替,天生具有敏锐洞察力与时代感知力的他

学位

托马斯·哈代进化向善环境与性格小说

儿童颅内室管膜瘤术后放射治疗的护理

介绍了 16例儿童颅内室管膜瘤术后放疗的方法和护理体会 ,在护理中首要注重心理护理 ,放疗中密切观察颅内高压症的表现 ,给予及时的处理 ;其次做好全过程的健康教育及外周静

期刊

儿童室管膜瘤放疗护理

基于深度强化学习的弹道导弹中段突防控制

与本文相关的学术论文