【摘 要】
:
为提高无人作战飞机(UCAV)自主决策效能,提出基于逆强化学习的空战态势评估函数优化方法。以现有的正例与反例两类空战数据为样本训练一个RBF网络,采用逆强化学习得到不同态
【机 构】
:
空军工程大学航空工程学院,解放军94019部队
【基金项目】
:
航空科学基金(20175196019);陕西省自然科学基金资助项目(2017JM6078)
论文部分内容阅读
为提高无人作战飞机(UCAV)自主决策效能,提出基于逆强化学习的空战态势评估函数优化方法。以现有的正例与反例两类空战数据为样本训练一个RBF网络,采用逆强化学习得到不同态势下的态势值,实现了对现有空战数据的知识提取;利用Sigmoid函数的压缩作用,降低了整体态势值,加快了UCAV学习的收敛速度;采用自适应粒子群算法求解优化了态势评估函数中的权重参数,提升了对复杂空战态势的适应能力;仿真结果表明该方法能够优化态势评估函数,提高机动决策的收敛速度,在UCAV自主决策中具有一定现实意义。
其他文献
<正> 一、问题的提出 近年来,随着人民生活水平的提高,商场食品冷藏链工程正在逐步完善,因此,食品陈列柜和小型装配式冷库普遍被采用,为之配套的小型风冷式机组的应用被推向
我国的改革开放,需要适合国情的理论指导,邓小平建设有中国特色的社会主义理论是指路明灯。其中,邓小平的经济理论,为中国从贫穷落后走向繁荣富强,从解决温饱到实现小康指出
资产负债管理理论及方法,是西方商业银行在经营过程中逐步形成、发展起来的,是一套比较科学、完善的管理理论和管理方法。近年来,我国商业银行经历了一个发展的黄金时期,但同
对于含口径80 mm的高次非球面金属主镜、主镜顶点到像面距离仅为17.5 mm的薄型折反式光学系统,设计了带3安装耳的主镜,并利用组件合并及周向同环交错前向安装的方式,在保证所
经济发展新常态背景下,借力“一带一路”国家战略,寻求国际产能合作是化解钢铁行业过剩产能、推动钢铁企业实现脱困发展的重要途径。选准目标市场,推进产能“走出去”是当务
目的探讨急性自发性脑出血患者应用甘露醇治疗的有效性及安全性。方法将2010年1月-2012年9月于兴化市第三人民医院住院治疗的急性自发性脑出血患者共46例,随机分为甘露醇治疗
在数列求和问题中,裂项法是一种较为常见,也较为简单的方法.所谓裂项就是将数列的每一项拆成两项之差,以达到正负抵消化繁为简的目的,它体现了数学的简洁美.裂项的关键是对数
通俗音乐是商品经济时代的一大特色,我们必须辨证地看待,既不能排斥,更不能盲从。为此,鉴于通俗音乐所吸引的受众的年龄层次与心理特点,大学音乐教育必须担起重任,发挥自身作
本文分析并总结了列宁在各个不同时期关于"国家资本主义"的思想,阐明了列宁这些思想的产生和演进过程,从学术研究的角度为"经济尚不发达的社会主义国家可以借用‘国家资本主
对神宁集团建立完善定额标准体系、设置关键业绩考评指标、强化成本过程管控、前瞻性制定年度绩效实施计划,以此推进精细化管理进行了简要分析和总结。