基于强化学习的无线网络认知抗干扰决策研究

来源 :朱佳璐 | 被引量 : 0次 | 上传用户:bob2cici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线通信技术的发展,信道环境变得越来越复杂。无线通信由于其广播性质,十分容易受到恶意干扰者的袭击。针对未知且对抗的频谱环境,结合认知无线电以及机器学习技术,对抗干扰的方式也越来越灵活。强化学习因其无需模型,可在智能体与环境不断交互过程中学习最优策略的特点,被广泛应用在无线电抗干扰的领域中。本文首先针对存在中心服务基站的无线网络中多用户抗干扰场景,将其建模为多智能体的随机博弈过程,在平均场多智能体强化学习(Mean Field Multi-Agent Reinforcement Learning,MFMARL)的基础上,提出了一种基于MF Deep SM2的多用户抗干扰决策算法。中心服务基站根据该算法对认知用户观测到的频谱信息以及获得的奖励信息进行学习,查找认知用户的纳什均衡策略然后分发,可以有效规避干扰以及减少用户冲突。仿真结果表明,存在四个认知用户的扫频干扰场景下,MF Deep SM2抗干扰性能比起Independent Q-learning高出约68.2%,比起MF Q-learning和MF Deep Mellow算法分别提升16.2%和9.0%。然后,针对无线网络环境中无中央控制以及在线交流的场景下,为了解决多用户之间冲突及干扰影响问题,利用马尔可夫框架进行建模分析,提出了一种多用户联合抗干扰决策算法(Multi-agent Joint Anti-jamming Decision Algorithm,MJADA)算法。该算法融合长短期记忆库(Long Short Term Memory,LSTM)和深度Q网络(Deep Q Network,DQN),不仅在动作状态空间巨大的多用户场景下能够实现有效的收敛,而且在不同的干扰场景下都有很好的抗干扰效果。仿真结果表明,存在两个认知用户的扫频干扰场景下,MJADA算法的抗干扰性能比随机策略高出约72.3%,比独立DQN算法提升33.7%。
其他文献
人工构建的混菌体系在降解复杂化合物和合成高附加值产品等方面具有明显优势。本研究通过构建由“真菌-细菌”组成的人工混菌体系分别实现了正十六烷降解效率和2-酮基-L-古龙酸(2-KLG)产量的提高。将三个烷烃羟化酶基因SYHY、Alm A和alkm分别导入底盘细胞酿酒酵母,得到3株工程改造菌株。其中,菌株Alm A的正十六烷的降解率最高,96 h的降解率为14.48%。将基因SYHY、Alm A和al
脑-机接口(brain-computer interface,BCI)通过大脑的思维活动和外部环境进行信息交互,其组成通常包括信号采集、处理及输出等一系列硬件设备和软件技术。运动想象(motor imagery,MI)指大脑有运动意图但不执行实际肢体动作,是BCI的常用范式之一。MI-BCI可以应用于运动功能损伤患者的大脑可塑性修复。然而常规MI-BCI存在一些问题亟待解决,主要包括运动意图的解码
随着海洋油气资源开发活动日益频繁,海底管道的安全运行及防护受到广泛关注。受第三方活动影响,海底管道在落物冲击载荷作用下可能发生屈曲失效破坏,因此有必要对海底管道受冲击载荷作用的动力响应进行分析,研究影响屈曲失效破坏的因素,以便寻求合理的防护措施,保障管道的安全运行。鉴于以上原因,本文就单层管与混凝土配重层单层管在落物冲击载荷作用下的屈曲破坏进行研究,借助理论分析和数值仿真等方法探究管道在受冲击载荷
气测录井是油气勘探的关键环节之一,可直接发现油水气分层信息。近年来,页岩气等非常规油气储藏的开发,对气测录井的检测速度提出了严苛要求。然而,常规的气相色谱法费时、费力且易漏检,难以适应复杂油气储藏的实时检测需求,发展新型、高效的气测录井在线分析技术迫在眉睫。在各种气体在线分析技术中,拉曼光谱技术以其简单、快速、高通量等优势,在气测录井中具备良好的应用前景。然而,录井气体成分复杂且拉曼特征谱峰高度重
管道作为重要的能源运输设施,在具有高投入特性的同时也具有较高的风险性。伴随管道布线增多、在役时间增长,管道老化现象严重,由此引发的事件逐渐增多。由于管道输送的物质大部分为具有腐蚀性或沉积性的物质,管道壁厚易发生减薄,管道内部易造成沉积。为保证管道运行安全,及时掌握管道的运行状态,需要定期对管道壁厚和内部沉积进行检测。X射线检测具有高穿透特性,可根据检测图像实现管道壁厚的准确测量。其中外部透射法计算
刀盘是复合式盾构机的核心部件。施工时刀具与前方的岩石或土体存在剧烈的相互作用,承受巨大的切削载荷,同时刀盘结构也承受极大的载荷。因此刀盘的力学性能对装备的安全可靠性具有很大的影响。在刀盘力学性能评估中,刀盘的有限元静动力学强度分析和掘进过程动态仿真分析具有重要的作用,进行上述工作的第一步也是较为耗时的一步就是建立刀盘的有限元模型,鉴于此,本文研究了其参数化建模方法。首先,本文对复合式盾构机刀盘的结
郑思维/黄雅琼组合自2017年配对来就取得了不俗的成绩,取得了世锦赛、亚运会等各项大赛的冠军。本文希望通过对郑思维/黄雅琼与对手最后四拍的技术指标统计,分析它们的得失分特征规律。主要运用文献资料法、录像观察法、数理统计法、对比分析法对郑思维/黄雅琼在比赛中技战术运用情况进行对比,通过对郑思维/黄雅琼直接得分时倒数一拍、倒数二拍以及最后两拍技术、线路、击球区域组合使用情况分析它们在进攻时的得分特点;
共轭聚合物可用于制备有机薄膜晶体管(OTFT)等光电器件,具有广阔应用前景。直接芳基化缩聚(DAr P)是共轭聚合物的合成新方法,具有步骤少、原子经济、环境友好等优点,但存在单体反应活性和选择性较低等问题。本论文在噻吩的β位引入缺电子基团氟、氯、氰基,设计并合成了三类噻吩衍生物C-H单体,研究了它们的DAr P,并表征了所得聚合物的理化性质和半导体性质。发现三种含缺电子基团的噻吩衍生物均具有高的α
气候变化作为一项全球性议题,在带来气候扰动的同时,也促进热环境逐渐成为影响出行活动的重要因素。以热舒适为主题的研究逐渐增多,成果涉及学校、居住区等,近年来研究对象逐渐广泛。然而,针对儿童的热舒适研究目前多聚焦于学校等室内场所的静坐状态下,对于动态环境中热舒适研究少,研究及设计的缺乏也间接导致了夏季儿童户外活动受限。因此,户外环境下儿童热舒适需求是什么,景观设计又如何满足其热舒适需求,对于此的探索就
通过纳米驱油技术提高石油采收率是当今油田开采的重要发展方向。作为新兴的调驱剂之一,聚丙烯酰胺微球具有良好的耐盐性、耐高温性、可变形性,能够随水相进入油藏深部进行调驱,通过增大被驱洗过的油层体积和洗油效率,进而提高石油采收率。目前应用的微球多为微米级,无法顺利进入我国广泛分布的低渗透油藏。针对这种情况,本论文中采用反相微乳液聚合,制备了三种纳米级粒径的聚合物微球,并通过流变实验、微通道实验和油滴剥离