聚类多Agent强化学习认知无线电资源分配

来源 :北京邮电大学学报 | 被引量 : 0次 | 上传用户:mzhou2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对认知无线电多用户的信道和功率资源分配问题,提出一种基于用户聚类和可变学习速率的多Agent强化学习方法.首先使用分层处理分离信道选择与功率控制,采用快速最优搜索结合用户数均衡调节实现信道分配;其次,使用随机博弈框架对多用户功率控制问题进行建模,通过K均值用户聚类减少博弈参与用户数量和降低单个用户的环境复杂度,并使用可变Q学习速率和策略学习速率的方法进一步促进多Agent强化学习的收敛.仿真结果表明,该方法能使多个用户的功率状态和总收益有效收敛,并且使整体性能达到次优. Aiming at the problem of multi-user channel and power resource allocation for cognitive radio, this paper proposes a multi-agent reinforcement learning method based on user clustering and variable learning rate.Secondly, using hierarchical processing to separate channel selection and power control, a fast optimal search Secondly, using the stochastic game framework to model multi-user power control problems, reducing the number of game participants and reducing the environmental complexity of a single user by using K-means clustering, and using variable Q The learning rate and strategy learning rate further promote the convergence of multi-agent reinforcement learning.The simulation results show that this method can effectively converge the power states and the total revenue of multiple users, and make the overall performance sub-optimal.
其他文献
众所周知,在屏蔽客观存在内进行的电磁兼容测试会引入严重的误差。该文主要研究了一个通过覆盖镍-锌铁氧体网格来优化测试效果的衰减屏蔽室的实现方案。并通过理论计算验证了
本文针对瓷砖、玻璃等壁画设计了专用清洗机器人。文中阐述了该机器人设计中的几个关键技术,并着重介绍了控制系统的设计。 In this paper, ceramic tile, glass and other m
国家发展越来越快,城市化进程也在不断加快,人们的生活水平逐渐提高,工业化的发展给人类环境带来了极大的危害,环境污染问题越来越明显,在当前环境问题不断加重的今天,LNG,即
近年来,政府全面推进“节能减排”工作.全国各地开展“十三五”期间绿色制造及广东省绿色清洁生产的相关业务.在企业中使用天然气这种清洁能源,对于环境保护有重大影响.目前
会议
天然气长输管道由于链长面广、涉及设备多、所处环境复杂,投产期间容易受多种因素影响发生水合物冰堵、天然气泄漏、管道损坏等故障,严重损害企业经济效益,威胁周围群众生命
天然气是一种清洁型能源,已经在社会和日常生活中得到了普遍的应用.随着经济的不断发展,天然气已经走进千家万户,不仅推动了社会经济的发展,在使用天然气时还能有效减少空气
随着物质生活的不断提高,人们对生活质量的要求越来越高.在人类发展的过程中,随着技术的不断发展,人类对自然的需求已经达到无法满足的程度.人口,资源和环境问题不仅是我国社
本文概述了磁平衡大霍尔电流电压传感器的工作原理、基本结构、主要性能指标及国内外发展状态,介绍了TET系列磁平衡式霍尔电流电压传感器模块的特点应用方法及注意事项。 Th