基于深度强化学习的多小区波束成形技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:llll9909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了满足日益增长的移动通信业务需求,亟需提高蜂窝移动通信系统频谱资源利用效率。开放多小区频率复用限制是提高现有频谱利用率的有效方法,但是该方法会导致同频多小区间的干扰异常复杂。小区基站可通过部署天线阵列进行波束成形设计来控制自身小区用户间以及其它同频小区用户的干扰。然而,传统的多小区波束成形设计算法存在计算复杂度高、基站间信息交互负载大等缺点,难以应用于实际的蜂窝系统中。近年来,随着强化学习的发展以及神经网络的不断优化,深度强化学习(Deep Reinforcement learning,DRL)方法在各个工程控制领域取得进展。而在多小区波束成形问题中,DRL方法由于其自组织学习特性和数据驱动特性,能够让各个小区基站通过自身收集的经验调整波束来控制小区间干扰,使得算法复杂度与基站间交互开销大大降低。本文主要对在基站发射功率受限条件下对多小区系统中的和速率最大化问题进行了研究,并提出了基站间信息交互有限前提下的基于DRL中的多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)方法的多小区波束成形算法。主要研究内容概述如下:第一,研究在多小区场景下的系统和速率最大化问题,系统性地总结目前已有的集中式与分布式波束成形设计算法,并根据基站间交互协作程度将已有算法分为信号级协作算法以及波束级协作算法。通过对比分析已有算法,提出在现实多小区系统设置下的基于基站间有限交互的分布式波束级协作算法。第二,为解决多小区波束设计中存在的计算复杂度过高以及基站间信息交互开销过大的问题,提出了一种基于分布式MADDPG的波束成形设计方法。该方法根据用户的等效信道增益、干扰强度以及瞬时速率等信息,让每个基站通过深度强化学习不断调整波束从而最大化整个系统和速率。仿真结果表明,所提基于MADDPG的波束方法在计算复杂度以及基站间信息交互都远低于传统算法的情况下,使得系统频谱效率能够逼近传统集中式算法的性能。第三,针对实际蜂窝系统面临的信道信息误差以及基站间信息交互存在延时等问题,在上述基于MADDPG的波束成形方法的基础上,进一步改善其泛化性,通过采用具有鲁棒性的波束结构设计以及挑选合适的状态信息,进一步减少基站间信息交互开销并提高所提方法的鲁棒性。仿真结果表明,所提泛化性增强的MADDPG波束成形方法能够在系统存在信道信息误差以及基站间信息交互存在延时条件下仍具有较好的鲁棒性。
其他文献
伴随着经济全球化的推进,世界政治、经济格局的变化深刻影响着所有国家的经济发展。近年来,中国政府面对国内外错综复杂的政治、经济环境,出台多项经济政策并灵活调整以适应中国经济发展形势,经济政策不确定性逐渐提升并对中国宏观经济造成影响。商业银行作为宏观经济政策传导过程中的重要一环,不仅直接受到经济政策不确定性提高的冲击,经济政策不确定性对社会其他经济主体的冲击也会间接对银行产生影响。因此,研究经济政策不
学位
随着经济全球化,各国资本市场对外开放和国际贸易往来的不断深入,世界各国股市间的联动效应越发显著。学者对股市联动性的研究已不再局限于发达国家股票市场,近期研究发现金砖四国股市存在联动效应,甚至发达国家与发展中国家股市的联动效应也在增强。科创板作为我国的新兴股票市场,在科创板股票纳入MSCI中国A股指数后,其与作为“美国科创板”的纳斯达克的联动性不容忽视。研究纳斯达克与科创板的联动性具有显著的价值,对
学位
随着第五代移动通信网络(The Fifth Generation Mobile Networks,5G)的商业化,第六代移动通信网络(The Sixth Generation Mobile Networks,6G)研究工作推动迅速。6G通信网络将不仅局限于传统地面网络的部署,还会扩展其覆盖至高空和海洋,实现地面、卫星、海洋、空中网络的无缝连接。目前,天地一体化网络已经成为未来6G无线网络的研究热点
学位
基金作为我国居民众多重要的投资工具之一,经过了近30年的历程已取得了飞速发展。如今我国基金市场中已有诸多不同类型:股票型基金、债券型基金、混合型基金、货币型基金等等,其中FOF基金作为我国基金领域的新成员,是发展相对较晚的一类产品,与国外相比还处于起步阶段(秋俭,2018)。2017年9月8日,六只FOF基金正式向证监会申报公募FOF基金并得到同意,自此我国便有了第一批FOF基金产品。随着我国基金
学位
<正>"神奇的电磁铁"选自义务教育课程标准实验教科书《小学科学(粤教科技版)》六年级下册第2单元"能量及其转换"第12课。本单元围绕能量展开,教学目标是让学生从具体事例和装置中认识各种形式的能量,知道能量之间是能够转换的。基于学生已经学习过能量形式的转换,本课将对能量转换进行更深入的探究:电能如何转换成磁能。以具体装置—电磁铁—让学生深入体会能量的转换,在探究中发现规律,得出电磁铁的神奇特性。本课
期刊
人类视觉系统在感知场景几何结构上具有先天的优势,可以毫不费力的提取出场景中的点,线和平面等几何结构。如何让计算机也具有类似人类视觉系统感知外部场景结构的能力是计算机视觉领域中的一个基本问题。二维图像可以认为是三维世界在二维空间上的投影,蕴含着丰富的现实世界的三维结构信息。从二维图像中提取三维场景中的几何结构信息是场景结构解析中的研究热点。Wireframe在表示场景几何结构信息上具有简洁高效的特点
学位
<正>【教学目标】一、科学概念1.电磁铁具有接通电流产生磁性、断开电流磁性消失的基本性质。2.改变电池正负极的连接方法或改变线圈缠绕的方向,都会改变电磁铁的南北极。二、过程与方法1.制作铁钉电磁铁。2.做研究电磁铁南北极的实验。三、情感、态度、价值观培养认真细致、合作探究的良好科学品质。
期刊
目的 对比18F-氟脱氧葡萄糖(18F-FDG)正电子发射断层显像(PET)/电子计算机断层扫描仪(CT)不同标准摄取值(SUV)阈值计算的代谢体积参数对非小细胞肺癌预后的评估价值。方法 收集行18F-FDG PET/CT检查的非小细胞肺癌患者178例,分别以SUV=2.5、SUV=4.0、40%最大标准摄取值(SUVmax)、50%SUVmax计算代谢体积参数[代谢性肿瘤体积(MTV)、病灶糖酵
期刊
并购作为一种企业投资,从微观角度看,不仅可以帮助企业扩大规模,提高企业管理水平,还可以加快企业技术升级,提高核心竞争力;从宏观角度看,又可以通过市场化的手段调整产业结构,盘活存量产能。当前的中国经济,非常需要借助并购市场的发展来度过这个转型期。虽然中国学者对并购绩效的影响因素做了非常广泛的研究。包括外部经济、并购特征、公司特征等等,但是可以发现对于公司高管的特征这一因素的研究中,大多将高管作为一个
学位
目的 分析缺刻基因1(Notch1)、第10号染色体同源缺失性磷酸酶—张力蛋白基因(PTEN)表达在非小细胞肺癌(NSCLC)组织中的相关性及其与患者预后的关系。方法 选取134例NSCLC患者为研究对象,收集患者NSCLC组织及对应癌旁组织,免疫组织化学法测定两组织Notch1、PTEN表达,使用阳性细胞比例及染色程度评分的乘积评价Notch1、PTEN表达的阴性、阳性,采用Spearman相关
期刊