论文部分内容阅读
在无人机空中格斗过程中,由于无人机自身状态以及空战态势,敌我双方机动动作及行为策略的选择具有极强的不确定性。针对这个问题,将强化学习方法引入无人机空中格斗过程,建立无人机机动模型及动作集;将空战态势评估函数作为强化学习中的信号函数;采用概率神经网络(PNN)作为对敌机动预测单元;在敌我双方战场信息完全感知条件下,该算法能够不断学习,使无人机通过与环境的交互来掌握其最佳机动行为策略,实现无人机的一对一空中对抗。