基于深度强化学习的无线异构网络多维资源分配方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:leolee4510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构网络已经成为第五代移动通信技术(The 5th Generation Mobile Communication Technology,5G)的重要组网方式,其通过在宏基站覆盖范围内部署多种类型的小型基站,缩短终端设备与基站间的距离,可有效提高频谱利用率和网络容量。然而,5G商用时代推动了数据流量和智能设备的快速增长,同时催生了具有多样化业务需求的新型智能应用程序。为了满足未来密集异构网络架构中日益增长的服务需求,缓解网络频谱、计算与缓存资源的短缺,设备到设备(Device-to-Device,D2D)通信、毫米波、移动边缘计算(Mobile Edge Computing,MEC)等很多新型技术被广泛应用,在提升网络性能的同时也给无线网络资源分配带来了新的挑战。一方面,多样化的服务需求促使资源分配问题由单一的通信资源拓展到通信、计算和缓存资源的联合优化,多维资源之间紧密联系且相互耦合,加大了多维资源分配的难度。另一方面,异构网络环境动态复杂,环境信息难以被准确获取且优化问题中变量维度高,传统优化方法难以快速求解复杂动态环境下的多维资源分配问题。近年来,人工智能,尤其是深度强化学习(Deep Reinforcement Learning,DRL)方法通过智能体与环境动态交互优化策略,为解决无线通信网络资源管理中的复杂优化问题提供了有效途径。因此,本论文重点研究基于DRL的无线异构网络中的通信、计算和缓存多维资源分配方法,主要研究内容如下:1)针对用户设备间频谱共享与干扰管理的问题,研究了基于深度Q网络(Deep Q Network,DQN)的异构网络D2D通信模式选择和信道分配方法。首先,提出了一种具有蜂窝和毫米波频段且支持D2D通信的异构网络模型,其中D2D用户可选择蜂窝模式或毫米波模式进行通信。其次,定义了在蜂窝和D2D用户服务质量需求约束下以最大化系统总速率为目标的D2D通信模式选择和信道分配联合优化问题。最后,设计了一种基于分布式多智能体DQN的资源分配算法优化模式选择和信道分配策略。仿真结果表明,所提算法具有良好的收敛性能,与其他现有方案相比,所提方案能够实现更好的系统性能。2)针对内容请求业务的低时延需求与服务器缓存容量受限的问题,研究了基于多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)的异构网络协作边缘缓存方法。首先,提出了一种两阶段协作边缘缓存策略,包括内容放置阶段和内容交付阶段。其次,定义了以最小化每个小小区的内容交付时延和缓存命中率之差为目标的内容缓存和带宽分配联合优化问题。最后,设计了一种基于MADDPG的协作边缘缓存算法求解优化问题,实现了对内容缓存和带宽分配的智能决策。实验结果表明,所提算法可以显著降低内容交付时延并提高缓存命中率。3)针对多样化的业务需求以及MEC服务器计算资源和缓存容量受限的问题,研究了基于MADDPG的异构MEC网络多维资源分配方法。首先,构建了具有不同业务类型的异构MEC网络架构。其次,提出了部分计算卸载和协作边缘缓存策略,并详细建立了通信、计算和内容交付模型。再次,定义了以最小化每个小小区的成本为目标的通信、计算和缓存多维资源联合优化问题。最后,设计了一种基于MADDPG的多维资源分配算法,通过集中训练和分布执行来有效优化计算卸载、内容缓存和资源分配策略。仿真结果表明,所提算法能够有效降低小小区的成本,获得更好的系统性能。
其他文献
国家公园既是重要的自然保护地,具有生态保育功能;又能够为国民提供生态旅游机会,是重要的户外游憩空间。国家公园的资源环境特征要求在国家公园内部开展高质量的生态旅游活动,达到生态保护和游憩利用之间的平衡。如何在维持生态保护和游憩供给可持续发展的同时,最大程度地优化游憩空间格局和功能、满足公众的游憩需求、为游客创造良好的旅游体验是国家公园管理机构面临的主要挑战之一。本文以钱江源国家公园为案例地,选择国家
学位
随着社会文明的进步,人们的观念普遍从追求物质的丰富性向追求以人为中心的精神需求转变,城市现代化建设的大趋势也由追求城市规模的增长转向城市品质的提升。在这一趋势下,滨海游憩空间的研究成果也日渐丰富,但是基于使用者感知角度的滨海游憩空间研究还处于初期阶段,内容不够完善。因此,本文从使用者感知角度出发,对滨海游憩空间的品质提升提出策略。本文首先介绍了研究背景,感知、滨海区、游憩空间以及滨海游憩空间等相关
学位
当前经济发展迅猛,制造业的发展由劳动力导向型转变为人才导向型,企业之间的竞争愈发激烈,在这样的新形势下,有越来越多的企业认识到绩效考核对于企业发展的重要作用。本文的H公司结合企业实际状况虽形成了自己的绩效考核方案,但存在较多的问题,尽管初见成效,但是公司员工仍旧缺乏活力,大锅饭思想严重。在当前的发展背景下,本论文从企业绩效考核方案优化研究的角度出发,参考绩效考核文献资料,选取H公司作为研究对象,通
学位
课堂反馈是课堂教学过程的重要环节,具有调节与控制教学活动的功能,起到优化教学的作用。随着科技的发展,互动反应系统(IRS)作为一种能够支持课堂互动反馈的教育技术在课堂教学中应用甚广,为提升课堂反馈质量,解决课堂反馈问题提供了技术的支撑。但是,作为一种支持课堂反馈的技术,必须从课堂系统的维度,设计有效的应用策略,才能发挥其优化课堂反馈的作用。通过问卷调查发现,当前的课堂教学中,在反馈方面存在“总结性
学位
西方马克思主义女权主义是从西方女性主义运动的第二次浪潮中衍生出来的一支重要流派,将马克思主义妇女理论与西方女性主义理论相融合进而探讨女性解放与发展问题,在西方女性主义理论发展史上占有重要的地位。马克思和恩格斯的妇女解放与发展思想、奥古斯特·倍倍尔的社会主义女性思想和西方其他的女权主义理论构成了西方马克思主义女权主义思想的理论渊源。同时西方马克思主义女权主义在继承马克思、恩格斯妇女解放思想的基础上,
学位
目的:将线上线下混合式教学应用到预防医学课程思政,探索课程思政教学新模式,提高预防医学课程思政的效果。方法:选择滁州某高职院校2019级和2020级高专康复治疗技术专业共4个班125名学生作为研究对象,2019级为对照组,采用传统的线下课程思政教学模式;2020级为试验组,采用线上线下混合式的课程思政教学模式。对2种教学模式的阶段性测试成绩、学期总评成绩、教学效果及学生自身成长情况进行分析比较。结
期刊
目前,全球汽车产业正朝着电动化、智能化、网联化、共享化的方向不断发展,这四大趋势意味着汽车行业与汽车零部件行业迎来了新一轮的技术变革。而我国汽车零部件企业大多凭借人口红利进入市场,缺乏技术优势,面临严峻的挑战。只有掌握核心技术才能增加企业核心竞争力,抓住汽车行业发展的机遇。因此越来越多的企业希望通过跨国并购获取战略性资源,提升企业的国际竞争力。文章基于企业资源整合的相关理论,以均胜电子并购高田公司
学位
在社会发展转型期,社会多元化及信息网络化程度持续加深,政治以及经济等方面不断发展的同时,公共危机事件也在频发,政府对公共危机事件的预防和处置在一定程度上反映其社会治理能力。网络舆情作为融媒体、大数据发展所伴生的新兴事物,具有影响公共危机事件演化的作用。在此背景下,党的十九大也提出,要“加强互联网内容建设,建立网络综合治理体系,营造清朗的网络空间”。因此,正确引导公共危机事件网络舆情,提升政府公共危
学位
伴随着经济发展呈现全球化趋势,在国内国际市场上,新兴市场企业都面临着冲击和挑战。企业可以通过海外直接投资来应对这种挑战。作为海外直接投资的一种进入模式,新兴市场企业通过逆向跨国并购发达国家企业,可以获取发达国家的先进技术等核心资源,进而取得竞争优势,实现价值创造。不同于传统的跨国并购模式,逆向跨国并购是处于相对弱势的新兴经济体企业对在品牌、技术等方面有着突出优势的发达国家企业实施并购。近年来,随着
学位
随着国内“双循环”、“产业升级”等政策的推出以及“新冠疫情”和地缘政治的影响下,国内并购市场呈现积极态势。然而企业在并购的过程中,往往也伴随着失败的风险,大量企业并没有取得规模经济效应,导致失败的原因有很多,而文化差异经常是企业并购失败的关键驱动因素。众多学者对此展开深入研究,但现有的文献主要集中在国家文化差异对跨国并购影响,鲜有学者从同一国家层面的微观企业文化进行研究。本文以2010—2021年
学位