基于强化学习的非协作动态频谱接入算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lovesnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着无线通信技术的快速发展,无线通信设备的数量和种类都呈现出爆炸式增长的趋势。然而在静态频谱分配策略下,频谱分配不均衡导致频谱利用效率低下,并加剧了频谱资源紧缺的现象。动态频谱接入作为认知无线电中的关键技术,可以允许认知用户在不影响授权用户正常通信的前提下,感知频谱现状寻找频谱空穴并伺机接入进行通信。在授权用户开放频谱,大量认知用户涌入目标频段的情况下,如何让认知用户在非协作情况下接入信道并且不与授权用户及其他认知用户发生冲突成为了关键问题。本文主要基于强化学习理论对动态频谱接入算法展开研究,具体研究内容如下:首先,本文对多用户非协作频谱接入模型进行研究,给出了系统模型的详细设计参数。在此模型基础上,结合强化学习理论对动态频谱接入算法进行研究,着重研究了基于Deep Q Network的频谱接入算法与基于Policy Gradient的频谱接入算法,分析了算法中存在的不足并提出了优化方法,最后通过仿真验证了优化后算法的有效性。其次,针对基于Deep Q Network的频谱接入算法在训练迭代过程中存在的收敛速度逐渐变慢、算法收敛后仍存在大幅度抖动的问题进行了分析,本文通过将固定学习率调整为动态学习率,同时通过权重因子调整动态学习率对神经网络训练的影响程度来实现提高算法收敛速度和降低曲线抖动幅度的目标。在本文系统模型下实验表明,用户满载情况时,改进算法能够有效降低用户间平均冲突概率,提高频谱利用效率与认知用户平均信息速率。用户过载情况时,改进算法性能较改进前仍有明显提高。最后,针对基于Policy Gradient的频谱接入算法训练迭代过程中存在的收敛速度慢、收敛周期长、部分训练效果差等问题进行了分析。本文通过引入Actor-Critic网络结构来将PG算法的回合更新模式调整为单步更新模式,同时结合Deterministic Policy Gradient思想引入确定性约束函数来降低Actor策略网络拟合目标的复杂度、结合本文提出的基于DQN的动态学习率频谱接入算法来提高Critic价值网络的收敛速度和稳定性。在本文系统模型下实验表明,用户满载情况时改进算法能够有效降低用户间平均冲突概率,提高频谱利用效率与用户平均信息速率。在过载情况下,基于PG的频谱接入算法失效而改进算法仍能够保持较好的接入效果。
其他文献
近年来,由于信息技术和电力电子技术的急速发展,电能质量的参数特性有了新的扩展和内涵,同时为不断满足着当今工业企业、用电用户以及电能污染治理等方面对电能质量提出的新要求,这就对电能质量的实时检测分析提出了新的挑战。传统电能质量分析仪虽然在实用中一直表现良好,但更多的是应用于传统变电站中,为满足智能变电站的数字化建设,研发电子式互感器的电能质量分析装置十分必要。虚拟仪器技术的快速发展为新型电能质量检测
近年来,越来越多医学会议在我国召开,医学口译市场需求极大,但医学口译研究较少,鲜有学者结合医学会议发言特点提出针对性的口译策略。本人于2019年9月9日参加的WFNS为国内外神经外科医生及学者提供交流平台,发言材料多为信息型文本,注重听众的理解与反应。所以,在本次任务译员担任交传口译的现实工作环境中,我们会遇到各种不同的问题,有时是对专业背景及术语不熟悉,或是发言人课件中图片较多,信息输出较大时给
目的:以往对缺血性脑损伤引起的认知功能障碍的研究,往往忽略了造模引起的视觉损伤对认知功能障碍的影响。本研究改良了传统的开颅电凝法脑缺血模型及四血管阻断(4-vessel occlusion,4VO)全脑缺血模型,建立了改良的开颅脑缺血再灌注模型、改良的4VO连续阻断模型与4VO间断阻断模型。此外,又选择经典的Longa线栓阻断模型、SD与Wistar大鼠的双侧颈总动脉结扎模型,比较上述缺血模型中的
目的:通过磁共振-动脉自旋标记(Arterial spin labeling,ASL)观察丁苯酞联合阿托伐他汀对伴大脑中动脉狭窄的急性缺血性脑卒中(Acute ischemic stroke,AIS)患者脑灌注以及神
鲢鱼为一种常见洄游性鱼类,主要以浮游动、植物为食。在污染严重的湖泊中,养殖鲢鱼被看作是一种调节水质的方法。通过在千岛湖放养鲢鱼,缓解水华现象。70年代美国同样引进亚
极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR),简称极化SAR,它是一种主动遥感技术,具有全方位,高分辨率,覆盖面积大的优点,与其他合成孔径雷达相比,极化合成孔径雷达拥有多种发射接收模式,可以获得地物目标更加丰富的信息,从而可以更加精确地对目标地物进行地物分类、变化检测、变化识别,所以本文选用极化SAR数据为研究对象。当前多数极化SAR
随着城市化的快速发展,城市建设用地不断扩张,传统的风景名胜区演变为市区型风景名胜区,位于风景名胜区内部的村庄也随之成为兼具城市、风景区、村庄三重功能属性的景中村。然而,景中村利用区位的优势和风景名胜区丰富的景观资源进行自身发展的同时,往往忽略与风景名胜区及城区的协调,存在建设过程中破坏风景名胜区良好的景观风貌。目前国内的景中村景观风貌研究主要集中在规划技术层面,多以一般景中村为研究对象。对于景中村
刑法解释不仅必要,而且是确保正确、合理适用刑法的重要途径,是连接刑法立法与司法的桥梁。围绕刑法解释所追寻的目标,主观解释论和客观解释论分别以探求“立法原意”和追寻“客观意思”展开了激烈的争论。通过对刑法主客观解释论发展历史的回顾以及各自具体观点与论证依据的梳理、剖析,认为绝对的主观解释论可能会导致刑法的生命力趋向枯竭,而绝对的客观解释论则有脱离罪刑法定原则的危险。经分析发现,两大阵营其实存在着“你
盲源分离技术是指在源信号以及传输信道未知的情况下,仅根据混合后的信号分离出源信号的技术。在实际生活中,往往都是源信号的数目多于观测信号数目的情况,也就是欠定情形,对于这种情况,通常采用稀疏分量分析来解决。因此本文基于稀疏分量分析对语音信号的欠定盲源分离技术进行研究。首先,在源信号充分稀疏情况下,目前的聚类算法易受噪声影响,针对该问题提出了改进的拉普拉斯势函数聚类算法。源信号充分稀疏指的是在每个观测
目的:糖尿病脑病(Diabetic encephalopathy,DE)是糖尿病导致的中枢神经系统并发症,以学习记忆能力下降等认知功能障碍为主要临床表现。诱导多能干细胞(induced pluripotent s