基于强化学习的雷达辐射源信号分选方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kevin_dai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代化战场上,雷达辐射源信号分选是雷达对抗侦察的先导环节,对侦察的效果具有重大影响。然而随着雷达辐射源信号的参数越发多变,调制方式越发多样,空间中的电磁信号数量越发庞大,传统的雷达辐射源信号分选方法已不能处理如此庞大的复杂信号。如何准确地、具有学习能力地、能够适应信号环境地实现雷达辐射源信号分选是本文的研究重点。强化学习作为近年崛起的热门智能算法,表现出强大的交互学习能力,能在与复杂环境交互过程中不断逼近最优解,而循环神经网络作为一种典型的深度学习网络,在处理序列信号时表现优异。本文将机器学习中的循环神经网络与强化学习运用于雷达辐射源信号的分选中,研究了一种基于自适应思想的雷达辐射源信号分选方法。首先,分析常见的雷达脉间调制方式,研究如何利用自适应思想处理雷达信号分选问题的方法。在分析了脉冲描述字中脉冲重复间隔(Pulse Repetition Interval,PRI)、脉冲载频(Radio Frequency,RF)、脉冲宽度(Pulse Width,PW)的多种脉间调制规律的基础上,给出了不同调制方式的数学模型和对应的用途。接着指出传统方法采用固定的顺序流程处理雷达信号,没有对分选结果进行评价的环节,即使分选结果较差也无法进行修正。因此本文研究了一种利用自适应思想处理雷达信号分选问题的方法,该方法基于分选结果的量化评价,引入了自适应调整环节,明确了自适应分选的目标——分选结果评价渐近优化,设计出了自适应分选的基本框架。其次,研究分选结果的评价方式,并利用循环神经网络加以实现。分选得到的结果是多个脉冲序列,对应着多个辐射源,为了评价该结果,需要对每个脉冲序列进行开集识别,即判断该脉冲序列为哪一类常见脉间调制方式,或者不属于任意常见脉间调制方式的“负样本”类。本文利用生成式方法解决开集识别问题,即由常见的脉间调制样本生成错误分选的样本,构建完备的训练数据集,然后设计循环神经网络并且基于训练集进行训练。仿真实验结果表明,本文设计的网络能够准确地识别分选结果,并给出合理的量化评价值。最后,引入强化学习方法,结合分选结果的评价完成雷达信号的自适应分选。自适应分选方法首先需要对原始辐射源脉冲序列进行初始分选,以达到“去噪”、“数据稀释”的目的,本文采用改进的基于密度的噪声空间聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)完成初始分选。接着基于强化学习中的多智能体思想与自动学习机算法,本文提出了多智能体自动学习机算法,并将其运用于初始分选后的分选结果自适应调整环节,即根据分选结果的评价,利用多智能体自动学习机算法逐步调整分选结果,达到分选结果评价渐进优化的目标。仿真实验结果表明,本文的基于改进DBSCAN与多智能体自动学习机的分选算法,相较于传统的雷达信号分选算法,无论是在理想环境下,还是在脉冲丢失与虚假脉冲的非理想环境下,分选的效果都更理想。
其他文献
红外图像由于具有全天候工作、隐蔽性好、受天气影响较小等特点,在现代军事领域应用广泛。红外舰船目标识别作为军事打击的关键技术,长期以来备受关注,成为无人机侦查和精确制导等领域的研究重点。然而,红外成像器的设备限制以及复杂环境噪声等综合因素会造成红外舰船图像分辨率较低、对比度较低等缺点,使得图像目标识别难度大大增加。因此,对红外图像进行单目标和多目标的快速、准确的识别具有重要的研究意义。首先,本论文分
学位
近半个世纪以来,随着空间飞行器的发展,各个国家开始对临近空间这一新的领域进行了探索,对临近空间飞行器的关注度逐年攀升。临近空间飞行器的飞行速度极快、机动能力强,这些优点致使各航天大国将目光都聚焦在临近空间高超声速飞行器上,且欧美各国的临近空间高超声速非弹道式武器相继应用于军事领域,其战略意义更加明显。因此,能够拦截非弹道式飞行器对我国的国防能力具有极其重要的意义,而非弹道式飞行器的拦截问题,重点在
学位
近年来,多架无人机以自组网的方式合作组成无人机自组织网络,具有低成本、多功能等特点,在军事和民用领域得到了广泛应用。同时,媒介接入控制(Media Access Control,MAC)协议对无人机自组织网络性能至关重要。然而,由于无人机自组织网络具有高动态、业务类型多样等特点,MAC协议的设计正面临着挑战。无人机自组织网络多应用在灾后搜救、野火检测等涉及多种业务类型的场景中,不同的业务类型对传输
学位
近年来,地震等自然灾害愈发频繁。每当灾害发生的同时,就会有大量的人力物力投入到抢险救灾,灾后重建的事宜之中。无线传感器网络,无人机等设备在灾害场景中发挥越来越重要的作用。由于此类无人系统的可提前部署性灵活,机动性高,智能性强,可以在灾害预防,灾害初期的数据获取,以及灾后实时监测场景下发挥重大要的作用。本文主要是针对多个无人机集群在震后进行大范围无线传感器节点监测数据采集任务场景进行研究,解决无线传
学位
随着现代仿真技术的不断发展以及人们对于仿真要求的不断提高,仿真模型逐渐变得越来越复杂,在提高仿真模型性能的同时,也使得人们对仿真模型的验证变得更加困难。面对复杂的仿真系统,传统的仿真模型验证方法在使用时会因其局限性而不再适用,因此寻求新的仿真模型验证方法已逐渐引起国内外仿真领域的重视。本文以仿真模型验证为研究背景,采用卷积神经网络的方法,实现对非同等条件下的仿真数据进行模型验证。本文主要开展以下研
学位
【目的】草原生态保护补助奖励政策(以下简称“草原补奖政策”)可有效改善牧民生活、促进生产转型和保护生态环境。【方法】运用模糊集定性比较分析(Fuzzy set qualitative comparative analysis, fsQCA)方法,探讨高寒草甸、高寒草原、荒漠草原3类典型社区牧民群众对现行草原补奖政策满意度的影响因素及其组态效应。【结果】补贴时效为解释牧民草原补奖政策高满意度的必要条
期刊
无人机和光电传感器的发展,使低空领域的精细化遥感成为可能。精细化遥感可为资源要素精细监测、目标精准识别、地物精准表型提供技术支撑,该技术要求从多维度、多层次表征地物特性,一般利用多光谱相机收集光谱信息,利用激光雷达获取空间三维结构。传统手段利用单一类型传感器无法获取多维数据;利用跨平台、跨时间的多源传感器,地物表征时空一致性差。因此,本文针对机载多光谱-激光雷达一体化数据采集系统展开研究,实现空间
学位
近年来无人机市场迅速发展,由于其操作简单,监管规章和监管手段却没有得以完善,无人机的滥用对公共安全和公民权益造成了威胁。为此构建反无人机体系是合理且有必要的,而探测、识别和跟踪是反无人机体系的重要组成。相比光电等探测手段,雷达系统具有全天时、全天候而且受到气候、环境的影响小,适合铺设后自动监管的广泛应用。而雷达体制中,线性调频连续波雷达结构简单、分辨率高具有优良的可探测距离,适合作为低小慢目标探测
学位
随着现代科技的进步,防空系统对空中目标进行识别时,使用分布在不同位置,拥有不同观测角度的多种不同参数传感器成为可能。同时防空系统识别并打击有威胁空中目标后,也需要对打击命中率进行评估。本文从空中目标的一维距离像仿真出发,采用了深度学习方法,在多个参数不完全相同的雷达,即多传感器;每个传感器位于不同的位置拥有不同的观测角度,即多角度观测下基础上,进行了防空系统目标识别、打击后命中率评估两个阶段的研究
学位
随着现代武器技术的发展,引信技术也在不断发展,导弹引信已经成为一个具有多项复杂功能的集成化系统,原有引信测试设备的测量精度和传输速度已经不能满足新的引信设备的测试需求。所以,面对越来越先进化、复杂化的引信设备,有必要研制出一款集信号采集输出、数据处理、复杂计算、结果分析、流程控制等诸多功能于一身的引信通用测试控制系统。本文首先对引信设备的实际测试需求进行分析,在此基础上制定了引信设备通用测试控制系
学位