论文部分内容阅读
传统比例导引律缺少时间和视场角的限制,在面对现代空战目标机动快的情况下,拦截效果也不理想.针对该问题,提出了基于深度强化学习的智能导弹控制律设计.该算法以导弹当前态势为状态输入,考虑到导弹追击过程中时间和视场角的限制,以此设计奖励函数,在连续的状态空间和动作空间中,导弹能根据当前态势自主选择正确的制导指令,及时追上机动目标.实验表明,该算法相比传统比例导引律,具有更强的鲁棒性,同时,导弹也具有了自主决策的能力.