基于最大策略熵深度强化学习的通信干扰资源分配方法

来源 :西北工业大学学报 | 被引量 : 0次 | 上传用户:parisjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法.该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探索性加速收敛至全局最优.该方法将干扰资源分配建模为马尔可夫决策过程,通过建立干扰策略网络输出分配方案,构建剪枝孪生结构的干扰效果评估网络完成方案效能评估,以策略熵最大化和累积干扰效能最大化为目标训练策略网络和评估网络,决策干扰资源最优分配方案.仿真结果表明,所提出的方法能有效解决组网对抗中的干扰资源分配问题,且相比于已有的深度强化学习方法具有学习速度更快,训练过程波动性更小等优点,干扰效能高出DDP G方法15%.
其他文献
目前有关堆的取证研究主要是针对Linux系统的堆和Windows系统的NT堆,然而怎样从转储文件中提取出Windows 10系统段堆信息并没有得到充分研究.为了重现Windows 10系统中段堆的内部信息,提出根据内存对象vtype描述信息中字段偏移定位并解析段堆内部信息的方法.使用池扫描技术定位进程对象,根据进程对象和进程环境块对象的结构信息获取进程堆的起始位置并扫描进程堆,再使用段堆特征值定位段堆的位置,进而提取出段堆的内部信息.依据分析结果,研发了基于Volatility框架的5个段堆取证插件.实验
参照《中国城市轨道交通智慧城轨发展纲要》中智慧车站示范工程建设内容及目标,文章在分析相关业务需求、技术难点的基础上,提出构建区域站点集中值守和远郊车站无人值守模式的具体解决方案.通过研发站区协同管理系统、智能客服支持系统,配置智能可穿戴设备,改造生产系统,实现中心站值班员集中管理区域各卫星站,线网线上客服中心替代线下各车站客服中心,场景化预案和日常业务直接通过岗位终端在线化和数字化,致力于智慧车站建设成果的价值输出和组织模式技术适配.相关成果可为其他城市开展智慧车站建设提供参考和借鉴.
通过对比碳纤维复合材料与传统金属材料电导率、介电常数及磁导率等电气特性参数的差异,分析碳纤维复合材料替代传统金属材料用于制造轨道车辆车体结构给电磁兼容设计带来的问题.针对轨道车辆整车电磁兼容技术要求,结合典型运营工况,从复合材料建模、整车电磁仿真、车体接地网设计和复合材料电搭接设计等方面,阐述碳纤维复合材料轨道车辆的电磁兼容设计思路和要点,以助于碳纤维复合材料在轨道车辆领域的推广和应用.