【摘 要】
:
针对空战中作战信息复杂、难以快速准确地感知态势做出决策的问题,提出一种博弈论与深度强化学习相结合的算法。首先,依据一对一典型空战流程,以随机博弈为标准,构建近距空战
【机 构】
:
四川大学计算机学院,四川大学视觉合成图形图像技术国家级重点实验室,陆军工程大学指挥控制工程学院
【基金项目】
:
全军装备预研项目(31505550302)资助课题
论文部分内容阅读
针对空战中作战信息复杂、难以快速准确地感知态势做出决策的问题,提出一种博弈论与深度强化学习相结合的算法。首先,依据一对一典型空战流程,以随机博弈为标准,构建近距空战中红蓝双方对抗条件下的双机多状态博弈模型。其次,利用深度Q网络(deep Q network,DQN)处理战机的连续无限状态空间。然后,使用Minimax算法构建线性规划来求解每个特定状态下阶段博弈的最优值函数,并训练网络逼近值函数。最后,训练完成后根据网络输出求得最优机动策略。空战仿真实验表明,该算法具有较好的适应性和智能性,能够有效地针对空
其他文献
<正> 如图所示,联轴器(苏联发明证书号684205)包括两个接盘式半联轴器1和6。在半联轴器1上沿圆周固定着带弹性衬套4的柱销2,弹性衬套4具有外金属套简3,柱销2上装有能转动的内
秋冬季节,天气变冷,温差变化大,容易导致心脏病患者血管脆裂,成为高血压、冠心病的发病诱因,寒冷所致的伤风感冒是病毒性心肌炎的诱因。寒冷会导致心脏病患者的交感神经兴奋性增高
<正> 在冲床上进行大批量大规格的工件生产时大多采用机械夹持送入和退出。但有些零件由于特殊结构及一些特殊要求而无法采用机械手夹持送入。例如,我厂是汽车标准紧固件专业
针对赵庄煤业工作面过3条空巷可能引发的片帮、冒顶问题,分析了3条空巷的危害程度和治理思路,制定了三步综合治理方案,采用高强注浆材料、高水充填材料,满足了不同的性能需求
针对甘薯受到病原菌侵害后,引发储藏病害产生毒素问题,提出了一种基于电子鼻技术,利用化学计量学对甘薯储藏病害的病变程度进行判别的方法,以期为库存甘薯储藏病害的识别提供
内部控制指对经济活动的调节、指导、控制和促进,引导人们的经济行为按照合理、合法的轨道进行,并对经济活动合理、合法性给予直接的支持和制约。大量的管理实践证明:得控则强、
刘女士最近一直对一件难言之事感到恐怖,无奈,她只好来到医院看医生。她说:“前些天,老公的‘那地方’出现了很多的小红点,我也感到不适,自己拿出小镜子一照吓了一大跳,我那里竟生出
<正> 轴承座内圆球面的加工方法过去是先在车床上加工好φD'h9、φd_1、φd_2等尺寸后再转到 T68镗床上用夹具以大止口φD'h9定位、端面靠平压紧,镗削内圆球面。这样
<正> 图1所示零件,其上有一个孔或几个孔,要求Ⅰ端孔相对于Ⅱ端孔同轴。若端面Ⅰ与Ⅱ之间的距离较大,则在普通机床,例如卧式镗床上镗孔时,往往是先镗一端孔,然后机床工作台带
<正> 绞盘机构系船舶甲板的主要机梅之一,渐开线圆柱直齿内齿轮是该机构中的一个主要零件,其材料为优质炭素钢45、模数m=18mm、齿数z=45、分度圆压力角α=20°、齿宽B=13