基于深度强化学习的认知无线网络动态频谱接入策略研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:sungod123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着第六代通信系统从构想中诞生,需要大量带宽的数据密集型应用遍布生产生活的方方面面,这对频谱的利用提出了巨大的挑战。然而,频谱资源作为通信发展的核心资源,面临着严重稀缺的局面。解决频谱稀缺的方法主要包括向更高频段扩展和提高频谱利用效率两种思路。虽然高频段频谱传输速度快,但是其波长短,所以在传输中能量损耗很大。因此如何在现有的频谱分配中提高频谱利用效率成为现代通信发展的关键问题。认知无线网络作为认知无线电和认知网络的结合产物,可以通过频谱分配有效提高频谱资源利用率。在认知无线网络中,用户根据信道占用状态分为主用户和次用户,而主用户在所分配频段上存在活跃和空闲两种状态。当主用户处于空闲状态,就会产生大量的频谱空洞,这会造成频谱资源的浪费。为合理利用频谱空洞,研究人员提出通过次用户对主用户频段上的频谱空洞进行感知和机会地接入,即动态频谱接入技术。然而,这种次用户在未经授权的频段上通信的行为对干扰管理和决策速度提出更高的要求。本文的研究目标是在频谱感知结果不完全正确的前提下,采用深度强化学习方法提出决策速度快且接入准确度高的动态频谱接入策略,提高频谱利用率。首先,本文建立了多用户多信道的认知无线网络的离散时间模型,为每个次用户开发一个分布式动态频谱接入策略,以在不影响主网络性能的情况下提高频谱利用率。同时,本文通过设计预警信号的方法保护主用户通信质量,即在主用户信道增益较低时将预警信息通过专用信道发送给主控系统,实现对主用户的干扰控制。其次,由于多用户多信道认知无线网络的节点数量庞大,节点间关系复杂程度高,传统算法在决策时需要大量的计算。本文充分利用了与认知无线网络一样具有认知能力且具有强大自适应性的深度强化学习技术,提出了基于改进的深度循环Q网络(Deep Recurrent Q Network,DRQN)的多用户多信道认知无线网络动态频谱接入方法。为了解决多用户多信道的复杂认知无线环境中大状态空间以及部分可观测性导致的高计算量问题,提出使用长短时记忆(LongShort Term Memory,LSTM)网络作为深度Q网络(Deep Q Network,DQN)中的Q网络充分利用历史信息减少计算量,并通过设置Dropout层防止过拟合的现象发生。同时为了解决DQN网络中存在的Q值过估计问题,采用双DQN(Double Deep Q Network,DDQN)网络将估计Q值和决策动作过程分别用两个网络训练,避免使用同一个Q值训练网络,提高了预测精度。试验结果表明,该方法可以得到较高的接入准确度和较低的干扰值。最后,本文提出了一种基于优先级经验回放机制的深度回声状态Q网络(Prioritized Experience Replay-Deep Echo State Q Network,PER-DESQN)多用户多信道认知无线网络动态频谱接入算法。由于在DRQN算法中,LSTM网络结构复杂导致收敛速度下降,因此本文采用回声状态网络(Echo State Network,ESN)利用底层时间相关性作为Q网络预测并估计Q值,与LSTM相比,ESN网络采用固定权重代替传统的梯度下降方法进行权重更新,大大降低了训练的计算量,缩短收敛时间;同时,为了解决在DDQN算法中以随机采样的方法在经验回放区内采样带来的Q值不稳定的问题,本算法提出利用基于Sum Tree的优先级经验回放(Prioritized Experience Replay,PER)机制,并结合重要性采样原则优化DDQN网络,对经验池中的样本按优先级采样,提升算法稳定性和接入准确度。仿真实验表明,基于PER-DESQN的多用户多信道认知无线网络动态频谱接入算法可以做出快速准确的动态频谱接入决策,并显著增加系统传输速率。
其他文献
<正>膝骨关节炎是一种软骨退行性变的慢性疾病,具有反复发作、高致残率特征。常好发于中老年患者。一般来说,在我国女性患者发病率往往高于男性患者[1]。给患者带来很大的精神困扰,对家庭及社会带来巨大经济负担。目前,现代医学对其主要是通过减重、功能锻炼、理疗以及透明质酸钠关节腔注射等治疗,但患者依从性差,疗效往往不尽如人意。探索能够提高患者生活质量、延缓疾病进程、减轻经济负担、不易复发的治疗方法,具有积
本文从老年人的心理需求角度出发,重点探讨老年居住空间的室内设计与老年人心理需求的关系。文章结合我国人口老龄化现状和对老年人心理特征及变化的研究,了解老年人的心理需求和老年居住空间人性化设计的需要。通过对行动力全自理型的老年人、行动力全半理型的老年人和行动力无自理型的老年人的3个阶段研究,分析了老年人在各个阶段的行为特征状况及心理状态情况,并将老年人的心理需求变成了居住空间设计的主要重点,提出了老年
教育数字化转型发展为信息技术与外语课程深度融合带来机遇和挑战。本研究依据社会认知理论,通过对国内某省属高校70名英语教师进行问卷调查,运用SPSS 23.0进行回归分析,探讨了高校英语教师计算机自我效能和结果期望对其信息技术与课程整合教学行为的影响作用。研究发现,自我效能和结果期望共同作用显著影响高校英语教师信息技术与课程整合教学行为;计算机自我效能和绩效结果期望对教师技术使用行为具有显著正向影响
本文是一篇英汉翻译实践报告,以《我与狐狸——非同寻常的友谊》的第十二章到第十三章为翻译文本。《我与狐狸》是加拿大的生物学家凯瑟琳·雷文的一本传记,其中记录了作者在乡下的科研生活,在这段时间里编写一本以小狐狸为研究对象的教科书。通过与小狐狸的相处,作者也有许多关于生活的感悟,领悟到了大自然的美好。本篇翻译实践报告分析了源文本的文本类型和语言特点,提出了在翻译过程中遇到的难点,并且对相应的难点提出了解
目的 分析乳腺癌疾病特点,探究西黄丸对雌激素受体不同状态的乳腺癌患者临床应用效果,以规范乳腺癌疾病治疗工作。方法 选取本院2019年1月至2019年12月收治的乳腺癌患者,从中抽取160例作为此次的研究对象。并根据雌激素受体不同形态进行随机分组,分别分为雌激素依赖的观察组和对照组,用A表示,非雌激素依赖的观察组和对照组,用B表示,每组乳腺癌疾病患者各40例。其中,观察组A、B乳腺癌患者采用西黄丸和
民族经济是中国经济的重要组成部分。研究发现,民族经济的发展与文化息息相关,民族地区的优秀传统文化同经济发展存在紧密互促的关联性。本文基于民族经济发展过程中分析文化困境的成因,从民族经济与民族文化协调发展、文化资源开发与利用等角度探讨走出文化困境的路径,以此提升民族经济的发展水平,缩小我国西部与东部地区发展差距。
随着空间信息网络的快速发展,用频设备种类和数量日益增长,将面临可用频谱资源不足的问题。在空间信息网络中实现频谱共享可有效缓解可用频谱不足的问题。然而,卫星的在轨高速运动,会使得空间信息网络中频谱共享场景非常复杂,且具有很强的动态性。为此,基于卫星实时频谱感知结果进行频谱共享可成为适应这种动态性的一种有效途径。但是,也会面临以下挑战:1)卫星感知数据海量,如何在不过多增加星地传输链路负担的情况下,将
<正>在五千年的泱泱岁月中,人们赋诗、咏诗、品诗,论诗,诗歌已然成为中华文化中一颗璀璨的明珠,其中丰富的想象、或平实或华丽的语言蕴含着诗人的心境及情怀,独特的语流节奏与和谐的音韵则赋予了诗词独特的音乐美。古诗词艺术歌曲《幽兰操》发展至今,历经千百年,由最初孔子所创作的古琴曲《碣石调·幽兰》至唐代诗人韩愈的诗词《琴操十首·猗兰操》,再至现代作曲家赵季平先生为其改编谱曲,最终将诗词中对君子品质的追求配
会议
建设在项目式学习基础上的项目式综合实践活动课程,是融合活动、环境、评价为一体的,指向深度学习的项目式学习活动课程。它是综合实践活动和研究性学习的发展,是激发学生潜能和兴趣、促进学生学习意识形成和渗透的过程,主要以项目式活动为课程实施平台,以综合性实践为课程实施基本途径,以研究性学习为课程主要实施策略,开展课程的建设与实施。