论文部分内容阅读
未来无线通信系统中频谱资源的稀缺以及复杂通信系统的运维成为无法回避的重要问题,为此学术界提出了一种基于认知技术的智能通信系统,即认知无线电系统。随着数字信号处理、计算机网络、人工智能等技术的快速发展,高度综合这些技术来实现认知无线电系统已成为可能。如何让认知无线电系统感知环境,并利用人工智能技术从环境中学习,通过实时重配某些跨层运行参数使系统适应环境的变化,从而实现复杂通信系统中满足用户需求的灵活可靠通信以及频谱资源的有效利用。已成为未来无线通信系统的研究热点,也是本文研究的出发点。本文主要对认知无线电系统的频谱感知与接入、传输与调度等自适应跨层无线资源管理方面的技术进行了研究,主要研究内容和取得的创新性成果如下:1、首先提出了认知无线电系统中动态频谱感知、接入、传输、调度的跨层优化框架。在此框架下,根据频谱可用性和频谱感知结果的变化规律,将授权系统对频谱的占用过程建模为交替更新过程。并由此推导出频谱可用性的统计规律,将频谱感知结果建模为离散时间马尔科夫链。由于基于该优化框架的约束马尔科夫决策过程具有特殊性,即认知无线电用户的行动不会对系统状态产生影响,根据这一特点,对传统的线性规划解法作了修改,简化了求解过程。为了解决马尔科夫决策过程因变量过多而导致的“维灾”问题,采用策略分离分别求解最优接入策略和最优传输策略,减少变量数。同时提出了不需要求解线性规划问题的启发式算法。2、在前面研究的基础上,将认知无线电系统应用于环境参数未知的情况,即系统缺乏马尔科夫决策过程状态转移的先验概率信息。为此采用一种强化学习算法,即R学习,使得系统能够自适应地从环境中学习近似最优策略。近似最优策略考虑了由缓存器内分组数量决定的QoS与长期平均功率效率之间的平衡问题。为解决R学习只适合于无约束的马尔科夫决策过程的问题,引入拉格朗日乘子法将约束问题转换为非约束问题。利用拉格朗日乘子的单调特性,提出了一种基于黄金分割算法的拉格朗日乘子搜索算法。此外还提出了一种状态空间压缩法和行动集缩减法以减少R学习所需的内存资源,并提高R学习的收敛速度。同时还证明了在某些合理的假设条件下,该压缩法和缩减法不会影响R学习收敛到最优策略。3、前面的研究工作针对的是单用户、单链路的情况,将其扩展到多用户竞争频谱资源的认知无线电网络中。利用微观经济学中的拍卖理论,提出了一种基于重复多标拍卖的频谱分配机制。在此机制下,网络用户是竞标者,接入点或基站在一次拍卖中充当拍卖人。竞标者为满足自身效用给频谱资源投标,由拍卖人根据最大化网络收益原则确定胜利者。为迎合不同的QoS标准,制定了三种不同的频谱分配优化目标,以及相对应的三种竞标者的价值函数。和其它分配机制相比较,本文提出的基于重复多标拍卖的机制具有几点优势:具有分散的特点,而且所需的信令交互以及计算开销都很小。