【摘 要】
:
诱饵技术是导弹突防的重要手段,诱饵的空域分布则是诱饵技术的关键一环。为求解弹道导弹突防诱饵有效分布空域问题,本文对导弹突防过程进行建模,建立导弹与诱饵运动模型、拦截器导引头识别模型以及突防效果评价模型。通过DDPG与MADDPG两种深度强化学习算法,仿真分析不同诱饵数量情况对突防效果的影响,并最终得到有效的诱饵分布空域。本文的主要研究内容如下:(1)通过对弹道导弹突防过程的分析,建立导弹突防过程模
论文部分内容阅读
诱饵技术是导弹突防的重要手段,诱饵的空域分布则是诱饵技术的关键一环。为求解弹道导弹突防诱饵有效分布空域问题,本文对导弹突防过程进行建模,建立导弹与诱饵运动模型、拦截器导引头识别模型以及突防效果评价模型。通过DDPG与MADDPG两种深度强化学习算法,仿真分析不同诱饵数量情况对突防效果的影响,并最终得到有效的诱饵分布空域。本文的主要研究内容如下:(1)通过对弹道导弹突防过程的分析,建立导弹突防过程模型。首先建立诱饵的实物模型,确定诱饵的尺寸质量等要素;分析诱饵在母舱内的安置方式及分离出去的释放过程,给定五条基本假设简化导弹与诱饵运动模型;建立导弹发射坐标系、诱饵与导弹相对运动坐标系,基于相对运动和椭圆轨道运行原理,推导诱饵相对于导弹的运动方程。其次阐述了红外导引头识别原理,分析红外导引头工作流程,结合太空背景下的光谱探测率,推导出太空背景下的红外导引头探测距离公式。最后研究了诱饵掩护下弹道导弹的突防效果,规范量化主要的突防效果影响因素,得到了多诱饵掩护下的突防概率公式,建立了突防效果评价模型。(2)将弹道导弹突防诱饵有效分布空域问题转化为诱饵的运动规划问题,基于深度强化学习理论,就是将诱饵视为算法学习中的智能体、太空环境与目标整体视为环境。构建诱饵运动环境,以诱饵当前位置、相对敌方拦截器的距离和飞行速度方向三方面信息为状态,设计了状态空间;将诱饵的加速度作为动作,定义了动作空间。构建了基于距离的奖励、航程负奖励、碰撞负奖励与被探测正奖励函数,得到了综合奖励函数。利用DDPG算法适合处理连续高维动作的特性,选择了DDPG算法和其改进的MADDPG算法的进行诱饵运动规划设计,完成了网络结构设计。(3)根据建立的模型,进行诱饵与弹头运动的仿真,得到了诱饵释放后的速度变化和相对导弹距离变化的情况;进行基于DDPG算法的模型训练,仿真得到一定构型的诱饵分布空域。结果表明,诱饵释放后分布在导弹周围10km的空域范围内,形成一定的空域构型,导弹具有有效的突防效果,同时也验证了本文建立的基于深度强化学习的弹道导弹突防诱饵分布空域研究模型的可行性。再进行基于MADDPG算法的模型仿真,得到的结果在DDPG算法的基础上,还具有更快的收敛速度、更高的突防效果以及更有效的导弹突防诱饵空域分布。诱饵对导弹突防的影响存在极限,采用DDPG算法训练的诱饵分布空域能使导弹达到86.0%的突防概率,而采用MADDPG算法训练的诱饵分布空域能使导弹达到88.0%的突防概率,比前者提高了2.0%的突防效果,验证了多诱饵环境中,MADDPG算法相比DDPG算法的优势,为弹道导弹突防诱饵构成有效分布空域提供参考。
其他文献
目前,我国小学新课标不断改革,体态律动教学法作为一种有效的音乐教学方式,对于小学音乐教学质量提升有其独特优势和较强的可操作性。本着提高教师应用体态律动教学法的能力、激发学生对音乐的兴趣、提高学生音乐素养的目的,文章通过对体态律动教学法的概述及其积极影响、运用现状及有效运用策略,提出小学音乐教学阶段运用此种教学法的有效方法,并通过调查与实践,探索体态律动教学法的应用价值在于有效地提高学生的审美和情感
使用Gleeble-3500型热模拟实验机进行TC4-DT钛合金等温恒应变速率热压缩实验,得到不同变形条件下TC4-DT钛合金的真应力-真应变曲线,分析了变形温度与应变速率对合金流变应力的影响;研究了热变形过程中TC4-DT钛合金的微观组织演变规律。结果表明:TC4-DT钛合金流变应力随着温度的升高和应变速率的降低而降低,并且变形过程中伴随着加工硬化以及动态回复与动态再结晶;不同条件下合金微观组织
以"新工科"建设为背景,探讨土木工程专业课程思政教学改革中如何挖掘思政德育元素、建立思政教学奖励机制和提升教师思政素养及教学能力,阐述土木工程专业特色人才培养的育人导向。
为落实立德树人根本任务,目前各高校均将课程思政建设作为高校思想政治教育工作的重中之重,力图实现思政课程与“课程思政”的有机统一,并取得了较好的教学改革成果,但关于实验课程的思政教育研究较少。文章对实验课程思政建设的必要性与可行性进行分析,基于土木类实验课程现状,从教师能力培养、实验教学内容、考核方式改革以及思政元素挖掘等方面提出土木类实验课程思政建设的途径。
<正>达尔克罗兹"体态律动"学说的核心是:音乐教育应从身心两方面同时入手去训练学生,让学生从刚开始接触音乐起,就不仅学习用听觉去感受音乐,同时学习用整个肌体和心灵去感受节奏疏密、旋律起伏和情绪变化的规律。只有身心两方面都真正投入到音乐进行中之后,内心对音乐的感受、理解才可能是精确的、生动的;同时,由此而产生的动作也可能是一种真正充满生命力的律动。达尔克罗兹"体态律动"是在听音乐的同时以身体运动来体
目的通过研究活血通络汤对SANFH兔Notch2、DLL3与PDGF表达的影响,探讨活血通络汤防治SANFH的作用机制。方法将192只日本大耳兔随机分为预防+治疗组A、治疗组B、模型对照组C、空白对照组D,每组兔各48只,第3周起A、B、C组采用贺氏造模法造模。A组第2周开始喂服中药饲料,B组第3周开始喂服中药饲料,C、D组均喂服等量普通饲料。并于第2、5、8周末检测兔血中Notch2、DLL3基
目的 探讨中性粒细胞CD64表达指数、降钙素原(PCT)、血清淀粉样蛋白A/超敏C-反应蛋白(SAA/hs-CRP)比值在感染性肺炎患儿诊断中应用价值。方法 收集2018年1月—2020年6月在医院住院的132例感染性肺炎患儿,根据感染类型将其分为细菌感染组55例,非细菌感染组77例(病毒感染25例,支原体感染28例,未知原因感染24例);选取同期50例健康体检儿童为对照组。采用流式细胞仪检测中性
目的 观察肺炎支原体肺炎患儿外周血CD64指数、中性粒细胞与淋巴细胞比值(NLR)和血清抗体效价的相关性。方法 选取2017年12月—2019年12月于本院确诊并治疗的疑似肺炎支原体肺炎患儿164例,将血清肺炎支原体抗体效价>1︰80的122例作为观察组,同期选取体检健康儿童130例作为对照组,检测2组外周血CD64指数、中性粒细胞和淋巴细胞绝对值并计算NLR;采用特异性免疫凝集试验检测观察组外周
目的 探究美罗培南联合丙种球蛋白治疗新生儿败血症的疗效及对hs-CRP、CD64、sTREM-1水平的影响。方法 选取2019年1月~2021年3月收治的68例罹患败血症的新生儿作为研究对象,根据治疗方案不同将其随机分为研究组(n=34)和对照组(n=34),研究组给予美罗培南联合丙种球蛋白治疗,对照组给予美罗培南治疗。对比两组临床总有效率、超敏C反应蛋白(hs-CRP)、CD64、可溶性髓系细胞
本文提出了一种C波段低剖面宽频带平面天线阵列。使用了电磁偶极子单元来排布了一种16×2的平面阵列。在4.4~7.4 GHz的工作频率展现了良好的辐射特性和阻抗匹配特性。天线阵列的电压驻波比在工作频段小于2.0。同时,还研究了一种Γ形式的电磁偶极子馈电线和平面地板对阵列的辐射影响。制作了天线阵列的样机,并进行了测试,结果显示,测试结果与仿真设计结果吻合良好。