一种基于深度强化学习的通信抗干扰智能决策方法

来源 :西北工业大学学报 | 被引量 : 0次 | 上传用户:rmbsaxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决战场通信智能抗干扰决策问题,设计了一种基于深度强化学习的通信抗干扰决策方法.该方法在DQN算法架构下引入经验回放和基于爬山策略(PHC)的动态ε机制,提出动态ε-DQN智能决策算法,该算法能够根据决策网络状态更优地选择ε值,提高收敛速度和决策成功率.在决策过程中,对所有通信频率是否存在干扰信号进行检测,将结果作为干扰判别信息输入决策算法,使算法可在无先验干扰信息条件下智能决策通信频率,在尽量保证通信不中断的前提下,有效躲避干扰.实验结果表明,所提方法适应多种通信模型,决策速度较快,算法收敛后的平均成功率可达95%以上,较已有方法具有较大优势.
其他文献
针对浅海移动声源的测距,提出了基于直方图滤波的水下测距算法。该算法以声传播过程中传播损失和目标运动参数以及接收信号作为先验知识,对声源位置函数形成的状态向量进行更新,从而实现浅海声源的测距,并用SwellEx-96实测海试数据库进行了算法的实验验证。结果表明:对移动声源的测距深度误差较小,而探测的水平距离在10 km范围时,水平距离最大测距误差在±10 m,并且可以通过改善目标运动参数等先验知识提高对声源测距的精度,验证了直方图滤波算法可较好地实现对水下移动目标的测距。
为降低武装直升机在破片/弹丸打击下的易损性,主要研究在单次和多次打击下由整机向关键部件的易损性指标分配方法。通过将单次打击同一方向上的系统部件划分为非余度不重叠、非余度重叠以及重叠余度3种情况,提出基于关键部件迎弹面积比例和关键部件易损性评估结果比例的2种指标分配方法;通过将多次打击下的系统部件划分为余度部件和非余度部件,提出基于关键部件易损性结果比例的指标分配方法。在此基础上,结合武装直升机的易损性减缩措施,通过迭代分析实现对应部件的易损性指标要求。对AH-64D直升机进行单次和多次打击下的数值仿真试验
随着GPU硬件设施的广泛应用,越来越多的分布式机器学习应用程序开始使用CPU-GPU混合集群资源来提高算法的效率。但是,现有的分布式机器学习调度框架要么只考虑CPU资源上的任务调度,要么只考虑GPU资源上的任务调度,即使综合考虑CPU与GPU资源的不同,也很难提高整个系统的资源使用效率,即使用CPU-GPU集群进行分布式机器学习作业面临的关键挑战是如何高效地调度作业中的任务。在对现有的方法进行分析后,提出了一种基于不均匀数据分片的策略,利用线性规划的原理,使得CPU任务时间与GPU任务时间尽可能接近,从而
利用逆概率加权方法和经验似然方法,研究纵向数据缺失和辅助信息下的分位数回归模型的估计与推断问题。给出了线性分位数回归模型的参数估计及其渐近正态性,定义了分位数回归模型的加权经验似然估计;在一定条件下证明了所得估计的渐近正态性,建立了估计的渐近理论。通过数值实验说明了所得估计的有效性。
水下回收过程中,AUV航行速度受到多种因素影响而产生变化,艉部操纵舵效随之改变,直接影响了AUV回收路径跟踪控制性能。根据AUV航行状态,采用强化学习方法对AUV控制器进行自主学习优化,能够改善AUV航向及深度响应的性能指标,提高路径跟踪控制性能。建立AUV路径跟踪导引律,设计航向及俯仰运动滑模控制器,保证系统对外扰动的鲁棒性;采用Q学习方法,根据AUV航速、跟踪误差及其变化率,对滑模控制参数进行离线训练优化,搭建RBF网络加快训练过程,避免“维数灾”现象;将训练得到的RBF-Q学习网络应用于在线控制,与
低频窄带噪声是缝翼噪声的重要组成部分,研究其产生机制是缝翼噪声抑制的重要途径。基于30P-30N多段翼的瞬态流场分析,采用本征正交分解(POD)和动态模态分解(DMD)方法研究缝翼瞬态压力脉动的模态结构特征,获得缝翼瞬态流场主要特征模态以及窄带频率分布;利用经验模态分解(EMD)和互相关分析,保留原始瞬态压力信号的低频特性进行重构,并根据特征点的延迟时间及几何关系确定低频窄带噪声源位置。研究结果表明,低频窄带声源主要集中在特征模态压力脉动较大区域,如缝翼尾缘、剪切层下游及回流区;同时,在非特征模态的缝道及
飞机在大迎角飞行时,其表面气流发生严重分离,气动力的线性变化遭到破坏,操纵性和稳定性出现不同程度下降,导致飞机失速或进入尾旋,失速特性与尾旋特性直接影响飞机的安全性。为了分析失速/尾旋特性,以某型大展弦比双座电动飞机为例,在风洞试验数据基础上建立了全量六自由度非线性大迎角动力学模型,经过数值仿真计算和分析,获取了某型电动飞机在大迎角下的失速/尾旋特性,根据仿真计算的失速/尾旋特性现象,进行飞行试验,验证了数值仿真的可靠性,为以后分析大展弦比系列电动飞机非线性大迎角下的失速/尾旋特性及试验研究提供参考。
针对传统的主题模型算法没有充分利用词间语义关系和上下文语境而导致主题语义一致性、可解释性差的问题,给出一种基于LDA2Vec主题模型联合训练的热点主题识别方法——NS-LDA2Vec方法。该方法通过扩展Skip-gram模型,将初始化后的文档向量和枢轴词向量联合训练,以获得上下文向量,然后利用该向量来预测中枢词的上下文单词,从而将主题信息嵌入到词表示和文档表示中,使得预测过程中负采样损失和Dirichlet似然项总和最小化,产生可解释性更好的文本表示。结果表明:所提方法取得的F1值最高可达到0.898,在
针对下一代无线局域网(wireless local access network,WLAN)多小区高密集部署重叠覆盖场景中,冲突加剧所导致的缓存信息收集效率低、系统吞吐量急剧下降的问题,提出一种基于接入点协作的多小区多用户全双工多址接入协议(access point cooperation based multi basic service set multi-user full duplex multiple access protocol,CMMFD)。设计了一种面向重叠覆盖区域站点(station,
为实现高校创新创业教育资源配置的合理化、效益最大化,构建了教育资源投入-产出评价指标体系,提出教育资源利用效率与配置效率的多目标函数模型,并利用粒子群优化(Particle Swarm Optimization,PSO)算法进行实验仿真及模型求解。仿真结果表明,通过优化,各高校创新创业教育资源利用效率与配置效率分别平均提升18.72%与20.98%,且趋向于均衡状态,能实现教育资源配置的优化。