基于强化学习的频谱决策算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:yjddstevens
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种新兴无线通信技术的出现,使得原本有限的频谱资源更加宝贵。但是根据相关研究数据表明,频谱资源在时间或空间维度上没有得到有效的利用,存在频谱资源浪费的现象。认知无线电技术通过赋予认知用户接入授权频段的权利,能够合理解决资源匮乏与利用率不高的问题。认知引擎作为认知无线电中频谱决策的核心,通过结合人工智能的方式,为认知通信中参数自适应问题提供决策方案。传统智能算法对已知或者变化较少的认知环境有显著效果,但认知频谱环境通常是动态变化的,而认知用户并不一定能够获得全部的信息,需要研究一种环境适应能力更强的决策算法方案。为了探索动态环境中认知用户的智能频谱决策,本文建立了基于强化学习算法的认知引擎模型。首先考虑授权用户和认知用户的下垫式频谱共享场景,简单利用强化学习算法研究了认知用户智能功率控制问题。然后针对认知无线电环境中认知用户易受到干扰的问题,研究了具有跳频功能的认知用户与智能感知功能的干扰器之间的相互作用。该模型利用强化学习的环境试错和反馈学习机制,将授权用户、认知用户与智能干扰器之间的动态交互作为学习的过程,在交互过程中得到自适应的优化策略选择。综合考虑信道选择和功率分配问题,在设计能效函数作为评价标准的基础上,提出一种融合改进强化学习的认知抗干扰决策算法。仿真结果表明,提出的算法能够较快速的收敛,选择的策略能够有效的优化认知用户在干扰情况下的性能,相比采用传统算法的性能提高11%以上。
其他文献
在国家的大力支持和推动下,我国政府创业投资引导基金(简称政府引导基金)发展迅猛。来自私募通数据库的统计,截止2014年6月底,我国已设立政府引导基金135支,管理的基金规模超
西方新公共管理运动提倡“公众即是顾客,行政即是服务”以顾客为导向的思想,强调把社会公众满意作为改革指导原则的重要性。公共服务满意度研究由此开始,各国在这方面进行了
未来的许多探测任务很大程度上依赖于装有尖端科学仪器和拥有先进导航能力的高自主移动机器人。为了使这些移动机器人能够探索更大的区域,提高它们的导航速度是非常有必要的。视觉里程计作为移动机器人的一部分,因为其可靠的性能和广泛的应用而引起了越来越多的关注。但视觉里程计需要在CPU上运行特征提取及匹配等复杂的计算机视觉算法,这需要较长的执行时间,导致其移动速度相对缓慢。因此,在机器人上实现特征提取及匹配等算
自1994年分税制改革之后,地方政府出现了财权与事权不对等的现象,为了应对我国地方经济建设的快速发展和城市化迅速推进的需要以及区域间竞争、政绩攀比等多方因素,土地出让
在极大规模集成电路(GLSI)中,由于特征尺寸的不断减小,杂质对于器件的危害显得异常突出,因此晶圆表面洁净度成为了影响器件成品率的重要因素。随着铜取代铝成为最有效的金属互
在社区治理的大背景下,作为社区自组织的业主委员会发挥着维护业主利益的重要使命,其自治能力的强弱更是我国基层民主建设的关键要素。本文将业委会自治能力分为三个维度来考