论文部分内容阅读
随着各种新兴无线通信技术的出现,使得原本有限的频谱资源更加宝贵。但是根据相关研究数据表明,频谱资源在时间或空间维度上没有得到有效的利用,存在频谱资源浪费的现象。认知无线电技术通过赋予认知用户接入授权频段的权利,能够合理解决资源匮乏与利用率不高的问题。认知引擎作为认知无线电中频谱决策的核心,通过结合人工智能的方式,为认知通信中参数自适应问题提供决策方案。传统智能算法对已知或者变化较少的认知环境有显著效果,但认知频谱环境通常是动态变化的,而认知用户并不一定能够获得全部的信息,需要研究一种环境适应能力更强的决策算法方案。为了探索动态环境中认知用户的智能频谱决策,本文建立了基于强化学习算法的认知引擎模型。首先考虑授权用户和认知用户的下垫式频谱共享场景,简单利用强化学习算法研究了认知用户智能功率控制问题。然后针对认知无线电环境中认知用户易受到干扰的问题,研究了具有跳频功能的认知用户与智能感知功能的干扰器之间的相互作用。该模型利用强化学习的环境试错和反馈学习机制,将授权用户、认知用户与智能干扰器之间的动态交互作为学习的过程,在交互过程中得到自适应的优化策略选择。综合考虑信道选择和功率分配问题,在设计能效函数作为评价标准的基础上,提出一种融合改进强化学习的认知抗干扰决策算法。仿真结果表明,提出的算法能够较快速的收敛,选择的策略能够有效的优化认知用户在干扰情况下的性能,相比采用传统算法的性能提高11%以上。