无线能量收集异构网络中基于Q-Learning的自适应优化

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zjfjh2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为支持智慧家庭应用,Femtocell异构网络中需要部署大量传感器。射频(Radio Frequency,RF)能量收集(Energy Harvesting,EH)可通过无线信号为设备充电,在未来Femtocell异构网络中将有广阔的应用前景。由于无线RF能量与信息都需要依靠无线链路传输,会竞争链路资源。因此,在Femtocell异构网络中,对信息和能量传输的联合优化研究尤为重要,主要存在如下挑战:(1)系统信息与能量传输参数间内在关联关系复杂,全局模型难以建立;(2)网络节点数量大、需要联合优化参数多,优化难度高;(3)获取全网链路状态开销大,系统实时优化困难大。强化学习通过智能体与环境的不断交互,利用环境反馈激励信号进行决策和行为的自适应调整,非常适合大规模网络的优化应用。因此,本文基于强化学习理论,研究了两种典型Femtocell异构无线EH网络的优化设计,具体创新工作内容如下:(1)首先研究了基于WPCN的Femtocell异构网络,其中传感器节点通过收集无线接入点的RF信号能量为自身充电。为了实现在满足用户信息传输和传感器充电需求的前提下最大化Femtocell网络信息容量的系统目标,建立了数学优化模型,通过调节Femtocell发射功率在有效抑制干扰信号对信息传输影响的同时利用干扰信号为设备充电。为求解该问题,设计了基于Q-Learning的自适应功率控制算法框架。为提高算法性能,设计了基于距离因素和惩罚参数的分段式奖励函数。为使设计更接近实际情况,考虑了反应实际电路特性的非线性EH模型的约束。通过对不同奖励函数和超参数取值下网络性能的对比,给出了网络性能行为的变化规律。实验结果验证了所提算法框架的有效性,并且表明基于距离因素和惩罚参数的分段式奖励函数具有更好的网络性能,同时显示采用实际非线性EH模型可有效避免传统理想线性EH模型带来的偏差。(2)进一步研究了更为复杂和更具普适性的无线信息与能量同传(SWIPT)的Femtocell异构网络,其中无线接入点通过射频信号在为传感器节点充电的同时将信息传输给信息用户。针对此种网络,将功率与SWIPT接收机功率分割因子进行了联合优化,目的是在保证普通信息用户和充电传感器的信息与充电需求条件下,最大化Femtocell网络信息总容量。针对此问题,本文设计了基于Q-Learning的自适应功率与功率分割因子控制算法框架。为了使设计更接近实际情况,仿真实验同样考虑了非线性EH模型的约束。实验结果验证了所提算法框架的有效性,并给出了不同奖励函数参数对网络性能的影响规律。结果表明,ε-greedy动作选择策略下的网络性能优于玻尔兹曼动作选择策略,玻尔兹曼动作选择策略适合于动作规模较小的场景。
其他文献
p27是1994年Polyak等发现的一个热稳定性蛋白,属抑癌基因, p27从二条途径控制细胞周期,一方面抑制CDK激活,另一方面p27尚可抑制激活后的cyclin-CDK的活性, 以此来阻滞细胞周期
寝室卫生管理是高校管理的一个重要组成部分,一直受到学校的高度重视,但效果往往不甚令人满意。针对这一情况,本文对寝室卫生的重要性、寝室卫生的构成、寝室卫生管理中存在的问
目的目前临床上已有多个量表用于检测患者抑郁和焦虑状态,本研究探讨GAD-7和PHQ-9自评心理测评量表对综合医院心血管疾病患者抑郁和焦虑状态评估。方法连续收集2016年3月至6
配电网损耗影响因素较多,需要找出具有关键影响性的因素,使配电网的节能改造更有针对性。采用经层次分析法变权处理的经典灰色关联法,分析了配电网主要损耗影响因素与线损率
针对地区电网的特点,分析了备自投在迎峰度夏或负荷高峰时段长期退出的问题。在此基础上,提出了基于能量管理系统(EMS)开发的备自投投退策略在线分析与实时闭环控制系统。系
根据免耕稻田纹枯病菌核在田间的分布特点,对纹枯病菌核量田间调查方法进行了改进。试验分别对15块免耕稻田采用传统的土壤淘洗法和直接观测法进行纹枯病越冬菌核量调查,结果
目的:通过构建急性心肌缺血模型,探讨心痛泰对急性心肌缺血大鼠新生血管密度、缺血心肌中Notch1、Dll4蛋白表达的影响。方法:100只SD大鼠,除假手术组10只外,其余大鼠予以结扎
<正>在麦当劳(McDonald’s)的招聘网站中,一则工作描述中写道:"我们正在建立一个团队,试图去改变这个世界上最有知名度的品牌——麦当劳在大众心中的固有看法。这个全新的团
随着电子商务的迅猛发展,快递作为物流服务的一种特殊形式面临着爆发式增长的业务量,也注定了快递企业在未来一段时间内将一直处于扩张和完善中。相较于其他物流服务,快递要求速度更快、成本更低、时间更短,基本不需要仓储功能。物流网络规划是快递企业服务效率和质量的关键,而网点布局逐渐成为快递企业之间最主要的竞争领域。针对城市内快递物流网络优化问题,本文设计了包含集运中心、转运中心和配送网点在内的三层网络拓扑结
全球范围内的“绿色浪潮”冲击着纺织品领域 ,加深了人们对纺织生态问题的认识。从纺织品处理生态学的角度出发 ,叙述了纺织废料的产生、处理、利用情况 ,结合国内外差距 ,提