基于深度强化学习具有能量收集和协作的超密集网资源分配

来源 :吉林大学 | 被引量 : 0次 | 上传用户:fbcpingqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超密集网络(UDN,ultra-dense network)作为解决物联网中移动流量需求爆炸增长问题的关键技术之一,在通过大量部署小型基站(SBS,Small Base Station)来满足网络容量的同时,也带来了大量的能量消耗。因此,在有效满足用户服务质量的基础上,UDN还需降低小基站的能量开销、提高系统的能量效率。近些年,已有许多国内外学者提出了不同蜂窝网络下能量收集小基站的资源分配方案。小基站可以通过能量收集(EH,Energy Harvesting)技术从自然环境中获取太阳能、风能等可再生能源来降低传统电网的能量消耗。但是在UDN场景中小基站数量众多,用户与基站间的信道状态较为复杂,从绿色通信的角度上如何采取有效资源分配方案是一个值得研究的问题。此外,强化学习(RL,Reinforcement Learning)作为近些年兴起的一种新的优化理论,在探索环境、机器学习和智能决策等方面具有传统优化方法不具备的优势。将强化学习方法引入到UDN的资源分配中具有探索和研究价值。本文的研究内容为UDN在具有能量收集和协作下,如何提高系统总吞吐量的问题。主要工作可以分成两部分:1.研究和解决了利用能量收集和协作技术来提高UDN系统吞吐量的问题。在这个问题中,小基站的能量主要来源为自身收集到的可再生能源和其它小基站分享的可再生能源。考虑到小基站可再生能量收集到达过程和通信信道等信息先验未知,我们采用了深度强化学习(DRL,Deep Reinforcement Learning)算法-DQN(深度Q学习)和DDPG(深度确定性策略梯度),根据所有小基站和被服务所有用户的环境状态等信息集中动态地控制每一个小基站的功率分配。研究表明,基于DQN的功率分配方案需要将动作空间(基站功率分配)量化,划分成固定的动作来选取,这会导致小基站的功率选取不是最优的。而基于DDPG的方案可以在连续动作空间上选取一个合适动作,避免由于量化误差导致系统吞吐量不是最优的问题。仿真结果表明,这两种功率分配算法可以很好地收敛,而基于DDPG功率分配策略下的系统吞吐量可以最大化。2.针对UDN中小基站数量过大带来的DRL算法状态和动作维度的指数增长,我们结合实际的网络架构提出了一种多智能体深度强化学习的算法MADDPG(多智能体深度确定性策略梯度)来解决这个问题。基于MADDPG算法的方案采用集中训练、分散执行的方式将每个小基站看作独立具有决策能力的智能体进行最优策略训练。相比于DDPG算法,这种算法在训练过程中有效降低了神经网络输入信息维度的大小。每个小基站仅在自身可观察的环境里就能做出最优的功率分配,这不仅解决了前面提及的问题,还一定程度上提高了UDN系统的抗干扰能力。最后,在仿真实验结果中可以看出,与传统的功率分配策略相比,我们所提出几种功率分配方案的优越性。
其他文献
随着我国经济的快速发展,GDP总量的不断攀升,如何使全体公民都能享受到发展带来的红利无疑成为更加重要的问题。为实现这一目标,党和政府做出了诸多努力,其中一个重要举措便
同原生铝相比,大力发展再生铝可以显著减少资源、能源消耗,降低污染物排放,具有良好的社会、环境和经济效益。铝合金在回收再生过程中,不可避免的富集一定量的Fe元素,而Fe在
细鳞鱼(Brachymystax lenok)属鲑形目(Salmoniformes),鲑形科(Salmonidae),鲑亚科(Salmoninae),细鳞鱼属(Brachymystax),近年来野生细鳞鱼分布范围逐渐缩小,野生种群急剧衰退,为了阻止该种群灭绝,对细鳞鱼保护和驯养显得尤为重要,在细鳞鱼驯养繁育中发现细鳞鱼会出现厌食、独居、水中打转、体表溃疡和肝肾脏出血症状,从患病鱼肝、肾、肠液和鳃中
随着不可再生化石燃料的过度消耗以及环境污染的加重,人们迫切寻找一种绿色可持续的能源来代替传统的石油、煤炭等不可再生能源。可充电锂-空气电池拥有超高的理论能量密度(1
一里坪地区位于柴达木盆地腹部,沉积了巨厚的新近系地层。多口井钻遇不同程度的油气显示,表明新近系具有一定的生烃潜力和成藏条件。目前关于新近系发育情况、沉积相带展布以
A357铝合金是一种在国内外广泛应用的亚共晶Al-Si合金,它具有优良的铸造性能、强度、韧性、抗疲劳性能和耐蚀性能,适用于航空、航天和军事等工业。我国多数企业生产的A357铝
随着移动互联网发展和智能手机的普及,人们对室内基于位置的服务(LBS,Location Based Service)需求日益增长,而室内定位在LBS中发挥关键作用。传统的室内定位技术,例如基于WiFi、蓝牙和地磁等信号的室内定位技术,都存在室内定位精度低和稳定性差等问题。新兴的室内定位技术,例如超宽带(UWB,Ultra-Wide Band)室内定位技术等,虽具有定位精度高的优点,但设备昂贵且部署
Pierre和 Jacques Curie于1881年发现压电现象,而超声技术用于医学始于上个世纪 30年代。50年代,Fry等将高强度聚焦超声(High Intensity Focused Ultrasound,HIFU)技术用于治疗
会议
能源对人类社会的发展起着重要作用,同时也影响和制约着国家综合实力的发展。然而科学技术和工业化的迅速发展,带来的是日益增大的能源需求,迄今为止,地球上所有国家的日常能
图像风格转换是一种可以将某种特定艺术风格图像的纹理信息转移到另一张自然图像上,使原自然图像在保持语义内容基本不变的同时具备该特定艺术风格的纹理特征的技术。现如今深度学习凭借其优秀的学习能力和图像处理能力在计算机视觉领域成为了最热门的方向。本文基于深度学习方法,针对图像风格转换算法做了一些研究。本文首先介绍了目前风格转换算法在计算机视觉应用中的研究价值和国内外研究成果及发展趋势。解释了传统算法的局限