深度强化学习技术在智能空战中的运用

来源 :指挥信息系统与技术 | 被引量 : 0次 | 上传用户:xiaoxi21175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着指挥控制网络化体系由中心集中式决策控制向边缘分布式决策控制发展,在未来空战场中,以深度强化学习技术为代表的智能决策控制方法在末端自主行动指挥方面将大放异彩.在深度强化学习技术理论成果与应用探索基础上,结合编队智能空战发展的迫切需求与关键问题,分析了该技术的应用潜力与实施价值,提出了解决思路与若干思考,可为空中编队指挥控制智能化发展提供指导.
其他文献
为了满足光伏组件自动化流水线快速生产和产品追溯需求,针对光伏组件车间流水线生产过程中采用人工放置条码存在的效率低下、作业安全风险等不足,设计了一种能够实现条码自动打印、裁切、放置和数据追溯的自动条码装置。介绍了自动打印装置的工作原理、整体作业方式、控制系统设计及配件选取原则;选取斑马条码打印机作为关键设备,通过控制系统连接打印机实现在线打印及自动放置。实践证明该装置在流水线生产取得了较好的应用效果
为分析滚针轴承在运行过程中的热特性对RV减速器精度的影响,根据实际工况建立了RV减速器滚针轴承的有限元热分析模型,研究摩擦生热量的计算方法和对流换热系数的选取,基于Ansys Workbench对滚针轴承进行稳态热分析,得到了实际工况下的轴承的温度场分布,并分析不同转速和负载对温度场分布的影响,通过试验验证了有限元分析模型的准确性.结果表明:滚针轴承运行时,内滚道温度最高,滚针次之,外圈温度最低;径向力和转速都会影响滚针轴承的温度场,且转速影响更大;仿真结果与试验结果误差在5%以内,可以有效预测滚针轴承的
大多数排产优化的研究往往针对一条生产线解决单一LBFFSP问题,无法针对企业缓冲区有限和多生产线等多因素的实际情况解决排产优化.针对该问题,提出了一种基本粒子群算法(Par-ticle Swarm Optimization,PSO)作为全局优化算法.引用了基于惯性权重的粒子群算法,通过改进该算法有效地避免基本粒子群算法陷入局部最优.建立以最小化生产周期和最佳缓冲区容量为多目标的带有有限缓冲区的混流装配线排产优化数学模型.采用PSO算法进行生产排序的结果与传统方法的排序相比较,缩短生产周期6.7%.提出的排
针对铁基高温合金GH2132,采用Al2O3-SiCw陶瓷刀具进行高速干车削试验,分析在不同切削速度下的切屑变形、切削力、切削温度、刀具后刀面磨损量以及磨损机理.研究表明:随着切削速度的增大,切屑由带状向崩碎屑转变,切削力表现出先增大后减小再增大趋势,切削温度逐渐升高,在v=250 m/min时刀具后刀面磨损量最小.刀具主要的磨损形式为正常前、后刀面磨损和边界磨损,以及非正常的崩刃.主要磨损机理为磨粒磨损、粘结磨损、氧化磨损.揭示陶瓷刀具高速切削性能,对切削铁基高温合金刀具的选择具有一定参考价值,为刀具表
针对机器人自动化航空发动机叶片磨削加工质量不高的问题,提出了一种基于模糊PID的力/位混合主动力柔顺控制.基于外部固定工具坐标的重力补偿算法解决了叶片重力对接触力求解的影响,根据坐标变换,完成接触力的精确感知.将机器人、工件和砂带轮简化成弹簧-阻尼二阶系统模型,利用最小二乘参数辨识方法建立系统模型.基于模糊PID的力/位混合力控制策略根据实际接触力与参考力的差值对离线编程轨迹进行在线修正,实现恒力控制.实验表明,相对于经典PID控制,基于模糊PID力/位主动柔顺控制算法可提高系统响应性能,降低稳态误差,改
针对绿色低碳分布式车间调度问题,建立以最小化最大完工时间和最小化总碳排放量为调度指标的低碳分布式柔性作业车间调度双目标优化模型,并设计了基于帕雷托优化方法的人工蜂群算法求解该模型.算法采用两阶段编码方式降低编码的复杂性,通过外部存档记录搜寻的帕雷托最优解,用多种交叉策略提高采蜜蜂和观察蜂的邻域搜索性能,提出单点变换提高全局寻优能力.最后,通过收敛性实验分析算法的性能,并设计了两组实验来分析不同类型的调度特征,并且对比了其他算法的优化结果,实验结果表明,文中所提的算法能够有效求解考虑碳排放的低碳分布式柔性作
针对无人机(UAV)对抗环境,研究了基于生成对抗网络(GAN)的无人机博弈对抗技术.首先,确立了无人机智能体的六自由度模型及动作生成框架;然后,针对无人机对抗环境下的态势信息的缺失,给出了相应的态势信息重建算法;最后,针对无人机博弈对抗决策问题,提出了基于生成对抗网络的博弈对抗决策生成方法.
为提升空中交通管理智能化水平与知识计算效率,结合空管数据时空特点,探索了知识抽取与知识嵌入方法.通过引入正则表达式和神经网络算法解决空管信息抽取问题,基于经典图谱嵌入模型,加入时间和空间2个重要维度信息,提出了支持时空信息的空管知识嵌入模型,并将该模型应用于航班延误等场景.试验结果表明,该模型增加时空信息后,对于基于空管数据集的知识推断效果比传统模型及新变种模型效果有显著提高.
多文档摘要是自然语言处理领域的热点研究问题之一.面向多文档对象,提出了一种基于预训练语言模型和关键词密度的多文档抽取式摘要算法.首先,通过预训练模型获取文档中所有句子的文档级句向量;然后,借助余弦相似度创建句子间的边连接关系,并提出了基于关键词密度的句子评分方法来提取摘要;最后,在基准数据集上的试验结果表明,该算法的Rouge性能指标优于其他具有代表性的多文档抽取式摘要算法.
研究了数字孪生的概念和定义,分析了信息建模作为数字孪生本质的基本规律,探讨了数字孪生模型的生成机理,阐述了智能制造、智慧城市和军事应用等领域中的数字孪生建模与应用,并从优化决策、缩减工期、降低成本、控制风险和提高质量等方面,阐述了数字模型对观察实体对象和改造实体对象的作用.