基于强化学习的无人机空中格斗算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hellolvkui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无人战斗机在军事领域上的应用越来越广泛,世界各国都在下大力气研制无人机,无人战斗机的出现也将改变未来的空战态势,成为决定战场的重要力量。在这其中,无人机的智能化水平将是无人机技术发展的关键,未来的无人战斗机将不仅能够通过传感器感知状态信息,区分敌我目标,还能够根据不同的作战任务,进行空战决策。空战决策理论经过近几十年的发展,逐步形成了以专家系统、微分对策为主的传统方法和以神经网络、遗传算法、蚁群算法为代表的智能方法。本文主要研究了基于强化学习的无人机空中格斗算法,主要做了以下几个方面的工作:一是对强化学习的基本理论做了详细的介绍,通过强化学习算法的对比分析,指出了当前强化学习研究面临的一些困难和问题,同时对强化学习的应用领域做了介绍。二是以强化学习的经典算法以及现阶段研究热点为依据,以强化学习系统中涉及的策略、值函数、回报函数等要素为核心,改进了算法性能。首先通过添加一个动机层,通过这一层,将先验知识引入到强化学习中,形成状态映射到动机、再从动机映射到动作的两层映射关系,提高了收敛速度。随后又采用模拟退火算法进一步提高了算法的性能。三是以空中格斗决策为重点,完成了RBF神经网络的动机引导强化学习算法的设计,通过对比不同决策意图下的飞行轨迹,验证了算法的有效性。
其他文献
为了加强对国土资源的管理和利用,促进经济可持续发展和社会的全面进步,迫切需要科学、及时地对国土资源利用情况进行动态的监测。遥感技术以其快速、准确、周期性短等特点在国土资源管理中具有明显的优势,研究和开发遥感卫星监测平台对国土资源利用情况进行动态监测已经成为了热点。变化检测作为遥感卫星监测系统中的关键部分,一直以来被广泛研究。在对目前常用的变化检测算法进行归纳总结和比较分析的基础上,本文重点研究了基
随着移动互联网的兴起,社交网络平台越来越多地被人们所熟知和运用。人们在社交平台上进行交流从而产生各种话题。本文主要是基于传播模型来挖掘社交网络上的潜在热点话题。
随着计算机技术、网络技术和电子商务的广泛应用,企业之间的竞争逐渐表现出快速、灵活、自动化与全球化的新特征。为了能够在竞争中取得胜利,企业必须由内部做起,缩短流程作
钓鱼攻击已经发展成为在线交易、电子商务及网络信息安全的主要威胁。它对用户和企业造成了严重的经济和信任危机,不仅危害了人们的利益、影响了人们的生活,而且影响了电子商
计算机和网络技术的不断发展将人类社会带入了信息化时代,随之而来的是倍受关注的信息安全问题。公钥基础设施(PKI)是解决信息安全问题的一种有效的方法。PKI的核心是认证中
肺结节是肺癌早期的主要征象之一。基于CT图像的结节检测与良恶性判别已成为国际上的研究热点之一。对结节的边界进行准确的分割是要解决的关键问题。基于C-V几何活动轮廓模
高可用集群是高性能处理器、磁盘阵列通过高速网络连接起来的能够提高系统服务可用性的并行体系结构。由于其高性能、高可用以及可扩展性好等特点目前已成为并行处理领域发展
Web2.0的兴起,使人与网络的交互程度增大,尤其是社交网站的出现,把实际生活中的人际关系和行为映射到网络,带来了网络上的朋友和人脉。社会网络的发现、挖掘、以及基于社会网
云计算的飞速发展伴随着许多大型数据中心的建立。海量的数据中心会消耗巨大的电力能源,增加云计算的操作成本,并导致二氧化碳的排放量升高,对全球气候造成影响。随着云计算
近年来,随着计算机与通讯技术的迅猛发展,笔记本电脑、手机、PDA等异构设备已融入到人们日常的生活中。这些异构设备具有截然不同的软硬件环境(平台不同,屏幕大小也不相同)。