基于强化学习的进攻防御作战辅助决策系统设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yyzw98
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界,随着人工智能技术在军事指挥领域的应用,战争形态已经发生了巨大的变化。在许多场景下,特别是无人机群作战场景下,战场形势瞬息万变,传统的依赖指挥官的指挥决策方式已经完全不能满足作战指挥的要求。必须针对各种场景研究指挥官辅助决策系统,为指挥官快速提供多套可行的作战方案,供指挥官选择。论文针对无人机群对地面目标的进攻作战和防空武器部署两个作战场景,研究指挥官辅助决策系统,决策系统具有指挥官意图识别功能。论文的主要贡献如下:针对无人机群打击地面目标的进攻作战场景,这是一种动态连续作战的场景,要求决策系统能快速给出多套对地攻击的优化的目标分配方案。经典的武器目标分配的优化目标一般为最大化毁伤效果,论文跟据实际作战需求,设计了综合考虑毁伤效果和效费比的目标函数。论文提出了一种基于神经网络的快速目标分配算法,相较于经典的遗传算法、匈牙利算法,该算法不仅将决策时间压缩到毫秒级,而且有些情况下的分配效能优于经典算法。该算法不仅运行时间快,而且灵活,可以很好地适应无人机群打击地面目标的作战场景。论文设计了基于蒙特卡洛法的效能评估方法,为指挥官提供决策支持。在指挥官意图识别算法部分,论文将指挥官的意图分为打击敌人和保存自己,具体来说就是毁伤效果和效费比的偏好程度,基于此设计了基于强化学习方法的意图识别算法。辅助决策系统通过和指挥官若干次交互,可以很好地学习的指挥官的意图。针对防空武器部署作战场景,决策系统主要是给出防空武器优化部署方案。论文提出了综合考虑掩护程度、部署消耗成本、部署所需时间的目标函数,将地图栅格化构建仿真实验环境,并分别设计遗传算法、差分进化算法、粒子群算法对部署问题进行优化求解。对比在特定场景下各个算法的优缺点,在多种不同的远程、中程、近程防空武器数量情况下,遗传算法给出了最优分配方案。论文设计了基于蒙特卡洛仿真的效能评估方法,进行了 1000次仿真实验,验证了决策系统的效能。通过效能评估,指挥官可以更直观的评价部署方案。在意图识别部分,将指挥官的意图抽象为对各个要素的重视程度,设计了基于强化学习的意图识别算法,辅助决策系统通过和指挥官不断交互,可以很好地学习到不同状态下指挥官的意图。最后,使用PyQt5界面设计工具,将仿真环境和辅助决策算法进行整合,设计实现了一个可扩展的的作战辅助决策系统,目前系统可针对无人机群对地进攻作战和对空防御作战进行辅助决策,智能地为指挥官提供作战方案。该系统界面清晰,操作简单,可在仿真环境下进行交互,识别指挥官意图。
其他文献
云计算技术推动了社会的发展,解决了大数据时代数据用户存储资源不足的问题,但这种集中化的存储架构也导致了云服务器面临资源不足的困境。密态数据去重技术能够在保证用户数据隐私性的同时,根据数据的相似性检测并删除冗余副本,从源头上缓解数据爆炸式增长导致的云服务器资源不足的问题。因此,国内外学者对云计算环境下的密态数据去重技术进行了大量研究。密态数据去重可以分为服务器端去重和客户端去重,后者有效解决了服务器
学位
区块链作为数字资产的结算日志,能够帮助金融机构进行跨组织交易。金融机构通常采用明文的方式将交易信息记录在账本上供第三方审计机构进行审查和监督。然而,明文审计会泄漏参与机构的财务收支、交易策略等隐私信息,存在经济损失的潜在危险。现有的方案通常采用加密的方式对账本的隐私信息进行保护,但是该方式不支持账本信息的审计,导致了金融机构交易过程的可信度降低。如何在保护账本隐私的情况下审计交易的正确性和账本的完
学位
基于深度学习的实体关系抽取算法表现出较高的性能,但是现有算法通常假设待预测的关系是一个固定的集合,在使用一个固定的数据集对模型进行训练之后,就用该模型进行预测。然而,在真实场景中,往往会不断出现新的样本和关系,导致现有实体关系抽取算法面临灾难性遗忘的问题,即模型只能识别正在学习的样本中包含的关系,而遗忘从以前任务中学到的知识,最终导致模型在以前任务上的性能严重下降。因此如何提高实体关系抽取算法的实
学位
分布式计算平台Spark在大数据领域迅速发展,其内存计算的特性相较于其他大数据平台,减少了磁盘读取开销,缩短了数据处理时间,在机器学习、图像处理等大规模计算应用方面具有广阔的应用前景。国内外许多企业已将Spark平台应用在实际生产环境中,如亚马逊、阿里、华为等。但Spark平台的性能方面仍需提高,Spark的任务调度机制基于同构集群的理想化设计,导致异构集群中高性能节点的硬件优势未被充分利用,从而
学位
随着信息化技术的快速发展,同类信息通过不同的呈现方式可以形成多种域的图像。这些不同域的图像信息互为补充,能够为人们的生活提供更丰富的视觉体验。因此,计算机视觉领域的研究人员对跨域图像转换算法进行了深入研究。跨域图像转换算法根据有无配对数据可分为有监督与无监督两种模式,每种方式都能够保证转换后信息的完整性,提升转换后图像的美观性。其中,基于生成对抗网络的跨域图像转换算法利用生成器与鉴别器互相博弈,最
学位
随着大数据、人工智能等科技的蓬勃发展,信息安全问题逐步成为当今社会最紧要的问题之一,国家更是出台了多项信息安全方面的要求规划,强调注重发展的同时要兼顾安全。而在各类信息安全问题中最不容忽视的就是个人信息泄露问题,攻击者会利用窃取到的用户个人信息对该用户进行攻击,导致被攻击用户在个人隐私、财产等诸多方面遭受巨大损失,因此,当前如何更好地保护和解决个人信息安全问题,成为了社会各界关注的焦点。身份认证技
学位
随着近几年智能家居行业的快速发展,越来越多的智能设备被生产并用于满足人们的个性化需求。然而,这些智能设备可能属于不同的供应商并且提供不同的功能与服务,因此很难将集中式的解决方案应用到智能家居系统中。区块链(Blockchain)技术因其不可篡改性、去中心化特性以及其他安全性方面的优势而具有解决智能家居潜在问题的可能。然而,随着终端设备数量与资源数量呈现爆发式增长,以及愈加繁复的应用场景性能需求,将
学位
随着深度神经网络的发展,深度学习在图像分类、目标检测、模式识别等领域都取得了与人类相当甚至更好的表现。然而,在现实世界中可能存在多个任务构成的数据流,神经网络并不具备在数据流中调整自身适应新任务的同时还能维持网络在旧任务上的表现的能力,因此会出现灾难性遗忘。这大大地影响了通过深度神经网络走向强人工智能的进程。因此,研究深度神经网络的持续学习算法,解决灾难性遗忘具有重要的理论意义与应用价值。现存的持
学位
蒲公英(Taraxacum mongolicum Hand.-Mazz.)作为一种药食同源植物,富含多种功能性成分,具有较高的开发价值。实验以蒲公英全草为原料,对蒲公英中醇溶及水溶性成分的提取工艺进行了研究;以蒲公英提取浓缩液为原料,研制出了风味和稳定性都较佳的蒲公英口服液,并对蒲公英口服液的抗氧化活性和抑菌活性进行了探究,以期对蒲公英的开发及综合利用提供有益的支撑。主要研究内容及结果如下:(1)
学位
高光谱成像系统将成像技术与光谱技术相结合来检测物体的空间特征,使高光谱图像可以捕捉场景的详细光谱分布。高光谱图像数据作为一个数据立方体,通常具有多个相邻的窄带,采集到的图像相比于普通RGB彩色图像包含更加丰富的信息,在诸多领域拥有巨大优势,广泛应用于许多遥感领域,包括目标检测、变化检测、分类、聚类和分割。然而光谱、空间等不同维度无法同时高分成像,这是由于高光谱成像机理的限制。在获取高光谱图像时使用
学位