基于强化学习的通信干扰策略生成技术研究

来源 :中国电子科技集团公司电子科学研究院 | 被引量 : 0次 | 上传用户:pioneerp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,得益于愈加成熟的人工智能技术,许多领域都进入了高速发展期。与此同时,人工智能技术在认知电子战领域中也使用得越来越频繁。干扰决策是认知电子战中非常重要的一个环节,传统的干扰决策技术灵活性较差,在应对具有一定抗干扰能力的通信系统时,有效干扰率较低,且容易造成资源浪费。干扰决策可以等效成一个贯序决策问题,而机器学习中的强化学习技术是解决贯序决策问题的有效手段,因此本文将强化学习技术应用于干扰决策,通过与环境反复地交互,干扰方可逐渐学习到最优干扰策略并自动生成干扰参数,以提升干扰成功率。本文所完成的工作主要包含以下几个方面:首先对强化学习的主要原理和研究对象进行介绍,并分析强化学习的一些经典算法,然后分析深度强化学习,以及基于策略梯度和基于Actor-Critic的两种主流深度强化学习模型。介绍数字通信系统的组成,并分析了对其进行干扰的可行性,以及对常见数字调制样式信号进行干扰的基本原理。然后分析了深度双Q网络(Double DeepQ Networks,DDQN)的基本原理,并针对通信方的状态转移过程是马尔科夫过程这一场景,提出了基于DDQN的通信干扰策略生成算法,利用BP神经网络搭建干扰决策网络,并针对传统强化学习中智能体“探索”与“利用”难以平衡的问题,提出根据历史时刻的平均奖赏值来作为控制探索概率ε改变的因子来对探索策略进行改进。实验结果显示,改进后的算法相较于未改进的算法以及传统算法有效干扰率更高,能在更短时间内达到收敛。随着与环境多轮次地交互,干扰方能够逐渐学习到最优干扰策略。最后分析了案例推理的基本理念以及多臂赌博机算法的基本思想,并针对干扰方在面对一种从未侦察到过的通信信号参数,且通信方参数变换周期较长这一场景,提出了基于案例推理-多臂赌博机的最优干扰参数搜索算法。首先根据侦参数从案例库中匹配出若干相似案例,并将这些相似案例的解进行加权求和计算一组参数作为多臂赌博机算法初始时刻的最优动作,以此来提高多臂赌博机算法的搜索效率。实验结果表明,结合案例推理的多臂赌博机算法相比于未结合的算法能够在更短的时间内搜索到最优干扰动作。
其他文献
机动车遥感监测(以下简称遥测)具有快速和便捷特点,可减轻人工执法工作量,为机动车污染排放监管和执法提供良好的支持.本研究对北京市2021年1—4月60个道路机动车遥测站点污染排放数据进行统计分析,获取了北京市汽油车大气污染物排放浓度(均为体积浓度)累积分布概率等排放特征.通过数据比对和典型现场实验,对车辆在稳态工况法(ASM)和遥测大气污染物排放数据进行相关性分析,并提出了北京市地方标准修订的建议
目的 探讨提壶揭盖法指导下的火龙罐综合灸对于改善脑卒中后尿潴留患者相关症状的效果。方法 选取2020年10月至2021年10月收治于河南中医药大学第一附属医院脑病一区的60例脑卒中后尿潴留患者作为研究对象,将其随机分为对照组(n=30)和观察组(n=30)。对照组行常规治疗和康复护理,观察组在此基础上实施以提壶揭盖法指导的火龙罐综合灸治疗,共干预14 d。比较两组患者住院期间的膀胱最大排尿量、平均
膀胱癌是泌尿生殖系统第二常见的恶性肿瘤,仅次于前列腺癌,具有高度异质性,其发生发展机制涉及多个基因组结构和功能的异常改变。利用分子生物学技术研究膀胱癌的分子分型对明确疾病发病机制、选择治疗方案具有重要意义。现对膀胱癌分子分型的研究进展作一综述。
为了满足生态环境部对非道路柴油移动机械污染物排放的控制要求,净化空气,本文对一种单缸风冷柴油机非道路四阶段的排放试验进行了研究,介绍了试验工况及关键试验参数的匹配。
人教版《英语》教材单元主情境图具有创设交际性互动情境、涵盖单元主要语言点、串联话题主线、呈现整体语境等功能。针对教材单元主情境图资源性价值被忽视的问题,教师应组合使用主情境图,运用主情境图进行单元导学、思维培养和写话创作。
利用中山大学环境气象综合观测车(载有3D可视型激光雷达、多普勒风廓线激光雷达、转动拉曼温廓线激光雷达)于2018年冬季在全国范围内(厦门-北京)的走航观测资料,对我国中东部不同地区和城市的边界层结构以及颗粒物分布特征进行了研究.结果表明:(1)在从南向北走航的过程中,边界层内各个高度的温度以及边界层高度呈下降趋势.(2)不同高度发生颗粒物污染的气象成因有所差别,其中1000 m高度左右发生颗粒物污
目的:比较不同预防性膀胱灌注化疗方案对UTUC患者的OS、CSS、IVRFS的影响。方法:回顾性分析2010年至2020年在我院泌尿外科接受RNU手术的387例UTUC患者的临床病例资料。术后随访10年,观察生存情况,同时对于患者的临床病理相关性数据进行统计学分析,选择Log-rank检验和Kaplan-Meier法,单因素多因素生存分析选择Cox回归分析。结果:所有患者的中位年龄为67岁[四分位
基于江西省“百村千户”的调研数据与中国数字普惠金融指数,运用ols模型、probit模型与分位数回归模型探讨数字普惠金融对农户收入多样性的影响机理,并进行实证检验。研究结果显示:数字普惠金融有益于丰富农户收入多样性。其一,能够通过拓宽覆盖广度,提升使用深度正向促进农户收入多样性;其二,能够显著促进农户创业,从而拓宽农户收入渠道;其三,数字普惠金融对农户收入多样性具有异质性影响,且相对于低收入者,其
随着我国经济与城市化建设的发展,社区网络化治理在城市的管理过程中,发挥着越来越重要的作用。其中,一方面基于社区的网格化治理,最大程度的发挥了社区的功能,并且极大的解决了最后一公里的难题。另外一方面,社区的网格化治理,也极大的调动了社区居民对于辖区管理的积极性和主动性,明显的提高了基于区域的精细化治理水平,以及基于区域的治理能力。并且,党的十九届五中全会,针对社区治理也提出了新的目标,以及新的要求。
粮食是人们赖以生存的重要物资,而粮食安全影响经济社会的进步和发展,也影响国家和地区的平稳与安全,是关乎国家民生大计的重要战略性物资。对于政府而言,必须注重强化粮食应急储备体系的建设,增强对于储备粮的安全监督管理,最大限度地避免储备供应短缺带来的风险,建立全面的粮食安全保障制度;必须要强化粮食储备的安全监管,做好这个最为基础的环节,才能确保落实好粮食储备相关任务。本文以大连市粮食储备安全监管为研究对