蜂窝网络中基于强化学习的D2D通信资源分配方案研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jbajba321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端设备的快速普及和高清视频等多媒体应用的迅猛发展,移动数据流量呈现爆发式增长,这导致对更高的数据传输速率的需求也在不断的增加,然而传统的蜂窝网络已无法满足海量数据传输的需求,因此如何提升受限频谱资源的效率以满足移动用户的服务请求已成为5G蜂窝网络中的关键性问题。由于设备间直接(Device-to-Device,D2D)通信可以有效的提升受限频谱资源的利用率,被视为5G蜂窝网络的关键技术之一。然而,D2D通信网络环境日益复杂多变且具有高动态的特征,使得基于数学建模的传统优化方法难以自适应当前的网络环境,无法实现高效、灵活的资源分配。因此设计自适应于动态D2D网络环境的资源分配方案已经成为了非常重要的研究课题。本文将分别针对动态变化的单蜂窝和超密集网络(Ultra-Dense Networks,UDNs)两个场景来研究D2D通信中的资源管理问题,并提出一种智能的解决方案—引入无模型的强化学习算法。论文的主要研究工作和创新点如下:(一)在单蜂窝D2D通信场景中,研究了基于多智能体强化学习算法的联合上下行频谱资源的子载波分配和功率分配方案。为了进一步提升受限频谱的使用效率,本文允许D2D用户联合复用蜂窝用户的上行和下行子载波资源,并在该场景下,研究了在保证蜂窝用户和D2D用户的基本数据速率需求的前提下,最大化所有D2D对的和数据速率并进行问题建模,其是一种混合整数非线性规划(Mixed Integer Non-Linear Programming,MINLP)问题。为此本文将利用多智能体双深度Q网络(Double-Deep Q-network,DDQN)算法来解决该联合优化问题。仿真结果证明本文所提的资源分配算法不仅可以有效提升D2D对的和数据速率,而且可以降低计算的复杂度。(二)在超密集D2D通信网络场景中,为了进一步提升系统容量,研究了基于集中式强化学习算法的D2D用户关联、载波分配以及功率分配方案。具体来说,本文所考虑的UDNs场景中D2D对可存在于相邻小基站的重叠区域内,在该场景下,研究了最大化系统整体的和数据速率问题,该问题不仅要优化D2D对和蜂窝用户的功率分配,还要优化位于小区重叠区域内的D2D对的用户关联以及子载波的复用,其也是一种MINLP问题。为此本文将利用集中式双对抗深度Q网络(Double-Dueling-Deep Q-network,D3QN)算法来解决该联合优化问题。仿真结果证明本文所提的方案可以接近理论的最优值。
其他文献
紫外光电探测器(UVPDs)在民用和军事领域都有着非常广泛的应用。各项研究表明基于宽带隙半导体的传统UVPDs具有优异的器件性能,但相对较高的制备成本限制了这类器件的大规模生产。而目前商用的硅基UVPDs需要添加滤光片,这在减少器件有效探测面积的同时增大了探测系统的复杂程度。在本文中,我们提出了一种与泄漏模式共振有关的无需额外滤光片的新型硅纳米线UVPD。主要研究内容如下:1.以聚苯乙烯微球为模板
学位
为了应对能源资源的枯竭和保护地球的生态环境,人们开始研究高效清洁的聚变能。托卡马克作为极具潜力的聚变约束装置,引起了国内外研究学者的广泛关注。为了保障聚变装置的安全稳定运行,需要在装置周围布置多套诊断系统来监控其运行状态。其中伽马诊断系统作为关键诊断之一,通过分析伽马射线能谱从而研究聚变产物、快速离子和逃逸电子行为等物理特性。数字化谱仪作为该诊断的核心测量仪器,它的性能对诊断起着至关重要的影响。E
学位
现代电子系统对于模数转换器(Analog-to-Digital Converter,ADC)的功耗、精度以及速度要求越来越高,相比电压域ADC,相位量化ADC对相位进行量化,而不受电压摆幅的限制和影响,因而成为当前的研究热点。本文进行低功耗相位量化ADC的架构研究与设计。首先,研究分析了现有相位量化ADC架构的不足,分析发现现有低功耗架构中,比较电平由输入相位θin和参考相位θref关联比较得到,
学位
近些年来,随着集成电路产业的飞速发展,伴随而来的硬件安全问题也逐渐引起人们的重视。其中硬件木马是电路安全攻击者为了达到改变IC功能或性能、泄漏敏感信息等非法目的而在电路中植入的恶意硬件模块。而当今集成电路专业分工的设计与制造模式所导致的一个后果,就是在设计或制造过程中电路面临着木马植入的风险,因为任何能接触到设计或制造并熟知电路的人,都可能对电路进行恶意的修改。因此,硬件木马已成为集成电路安全的主
学位
存储墙(memory wall)问题是限制现代计算机处理器性能提升的一个关键问题。其中,末级缓存(Last Level Cache)是片上系统中容量最大,也是最为关键的缓存,是提升CPU性能的关键因素。随着摩尔定律逐渐失效,我们已经走进了后摩尔时代。碳纳米管场效应晶体管(CNFET)是后摩尔时代作为CMOS技术替代品的有力竞争者之一。其具有更高的速度和更高的能效,这使得该项技术特别适应于构建高耗能
学位
频率或时钟发生器作为现代片上系统(SOC)中最重要的模块之一,越来越受到学术界和工业界的关注。在各种频率产生结构中,电荷泵型锁相环(CPPLL)在鲁棒性、设计复杂度、功耗和噪声性能之间取得了较好的折衷,因此成为我们的首选。作为一个闭环系统,CPPLL的性能在很大程度上取决于其环路带宽。与无线通信标准对本振的相位噪声提出严格要求不同,时钟发生器只需要保证其时钟抖动性能。换句话说,与使用不可避免地消耗
学位
2008年以前,肾小球滤过率的估算都是依托于传统经验方程和推广不广泛、应用有限制的临床方法。随着机器学习的日益兴起和机器学习算法在其他预测领域中对预测性能的提升,将机器学习算法应用于肾小球滤过率估算,由此肾小球滤过率估算得到了长足的发展。本文在前人工作的基础之上,研究了基于传统机器学习中的回归模型、卷积神经网络和多层感知机的肾小球滤过率估算,并使用支持向量机对卷积神经网络结构做出改进,论文的主要工
学位
近年来随着物联网技术的发展,人机交互技术在日新月异的进步,其中涌现了多种创新的技术,并且在多个领域都有实际应用。这其中,基于Wi Fi信道状态信息CSI(Channel State Information)的人体行为识别由于具有被动感知、非侵入性和无隐私问题等一系列优点,在过去的二十年中引起了许多研究人员的关注,取得了丰富的研究成果。但是,目前也还存在一些问题亟待人们去解决:现有的大量基于深度学习
学位
在集成电路技术尤其是制造工艺不断迭代发展的过程中,数字电路性能得到不断增强,但是模拟电路的设计难度却在增大,利用数字辅助电路替代一部分模拟电路,已经成为当今集成电路设计的潮流。时间-数字转换器(Time-to-Digital Converter,TDC)作为模拟-数字转换器的一个重要分支,主要由数字电路构建,这使得其性能受惠于CMOS工艺的进步而得到跳跃式的提升。其适用场景也因此更加广泛,可应用在
学位
随着电子技术的不断发展,对电子真空器件提出了越来越多的要求,而阴极作为电子管的核心部件对电子管的寿命起着决定性的作用。热阴极目前在高功率微波真空电子器件、卫星雷达、电子显微镜以及核聚变等高技术领域都有着成熟的应用,而本文设计的热阴极是应用于紧凑环等离子体物理实验中的一套真空电子发射装置。紧凑环是一种高密度自组织等离子体团,由于它具有很强的磁结构和高定向动能密度,从而能够穿过强磁场,所以紧凑环注入被
学位