基于DDPG算法的导弹末制导律设计

来源 :战术导弹技术 | 被引量 : 0次 | 上传用户:xrzs011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统比例导引律缺少时间和视场角的限制,在面对现代空战目标机动快的情况下,拦截效果也不理想.针对该问题,提出了基于深度强化学习的智能导弹控制律设计.该算法以导弹当前态势为状态输入,考虑到导弹追击过程中时间和视场角的限制,以此设计奖励函数,在连续的状态空间和动作空间中,导弹能根据当前态势自主选择正确的制导指令,及时追上机动目标.实验表明,该算法相比传统比例导引律,具有更强的鲁棒性,同时,导弹也具有了自主决策的能力.
其他文献
高超声速飞行器在飞行中存在高阻力和气动加热两大问题,逆向射流作为一种有效的减阻防热技术近年来得到广泛研究.基于逆向射流流场结构,介绍了逆向射流减阻防热方案的结构特征,论述了逆向射流减阻防热机理.通过与其它减阻防热方案进行对比,分析了逆向射流减阻防热方案存在的优势与不足.重点综述了逆向射流作为高超声速飞行器减阻防热方案的发展历史和研究现状,介绍了四种逆向射流与其他流动控制技术的组合方案.最后进一步探究了该技术未来发展趋势.