论文部分内容阅读
如今的无线网络朝着宽带化和业务多样化的方向发展,更多新的业务对传输容量和时延提出了更高的要求。然而现有的无线网络采用固定频谱管理模式,频谱资源利用效率低下,使得资源紧缺和业务需求之间的矛盾日益加剧。在这种背景下,FCC提出可以利用认知无线电技术提高频谱利用效率。在认知无线电网络中,认知用户通过频谱感知可以发现未被授权用户占用的空闲频谱,并选择一段空闲频谱进行接入,实现频谱的动态高效利用。认知用户的频谱接入包含频谱感知和频谱决策两个基本过程,因此对频谱感知与频谱决策的优化是认知无线网络的研究热点之一。本文研究的就是一种频谱感知与决策联合优化框架:序贯频谱感知。在序贯频谱感知中,认知用户通过学习获得频谱的统计信息,并用于对以后的频谱感知与决策行为进行优化。序贯频谱感知包含两个研究内容:一,认知用户以怎样的顺序感知频谱,即频谱感知排序;二,认知用户何时停止频谱感知并选择哪个信道进行接入,即最优停止规则。本文首先在单用户网络中针对不同的业务类型设计相应的序贯频谱感知方法。其次针对多用户分布式和集中式网络分别给出了分布式和集中式序贯频谱感知算法。论文最后研究了在未能获得频谱的先验统计信息时,如何设计序贯频谱感知方法。本文的主要研究内容如下:首先论证了序贯频谱感知框架之于传统频谱感知与决策框架的优越性。本文首先介绍三种基本的频谱接入框架:包括传统的频谱感知与决策分步优化框架和基于部分可观测马尔科夫过程(POMDP)的框架,以及序贯频谱感知框架。通过理论计算获得了这三种框架下,认知用户的平均传输容量和单位能量传输容量,从理论上比较了三种频谱接入框架的优劣。频谱感知与决策分步优化框架可以获得最高的空闲频谱发现效率,却有最小的时隙效率;相反POMDP框架可以获得最大的时隙效率,却有最小的空闲频谱发现概率;而序贯频谱感知可以在空闲频谱发现效率和时隙效率间作出很好的平衡,以最大化认知用户的传输性能。仿真结果表明频谱感知与决策分步优化框架的性能最差; POMDP框架虽然可以获得最优的能量效率,但是却获得很低的传输容量;序贯频谱感知框架在总体上最优的,它可以获得最高的传输容量和较高的能量效率。其次针对不同的业务类型提出了不同的序贯频谱感知方法。传统研究并没有考虑认知用户的业务需求,不同的业务类型应该有不同的QoS(Quality of Service)要求,对于实时业务,要求较小的时延;对于非实时业务,要求较大的传输容量。针对实时业务,本文提出了新的贪婪算法,该方法在进行信道排序时综合考虑了信道空闲概率、信道达到最低速率限的概率和探测SNR(Signal to Noise Ratio)时间消耗的影响,比起传统方法能获得更小的频谱接入时延。针对非实时业务,本文提出了动态规划方法和次优的贪婪算法来进行信道排序,该贪婪算法由于作了简化运算,因此其性能会比动态规划方法差,但是其计算复杂度比动态规划方法低。仿真实验表明新方法比传统方法具有更高的传输容量。在获得了最优信道感知序列后,本论文通过逆向递归算法获得最优停止规则,充分利用信道多样性,以进一步增大传输容量;并设计了次优的1-SLA(1-Stage Look-Ahead)停止规则,在保证算法性能的同时降低计算复杂度。但是实施停止规则需要在感知信道空闲后发射导频信号探测信道质量,这将消耗额外的时间和能量。本文最后通过实验检验了引入停止规则的有效性,结果显示当信道个数较大且SNR探测时间较小时,更适合采用引入停止规则的最优信道排序法。然后研究了多用户认知无线网络序贯频谱感知方法。在多用户情况下,各用户的频谱感知序列间会相互影响,因此针对单用户设计的序贯频谱感知方法不适用于多用户情况。在研究多用户网络序贯频谱感知方法时,不仅需要考虑信道空闲概率、信道质量,还要综合考虑用户多样性和多用户间的冲突。本文针对分布式网络和集中式网络分别提出了分布式和集中式序贯频谱感知方法。新的分布式贪婪算法改进了传统单用户贪婪算法中的势函数,把用户选择信道这一单向选择扩展到用户-信道双向选择的过程,充分利用用户多样性提高网络吞吐量。新的集中式算法,利用频谱感知矩阵表示各个用户的频谱感知序列,对冲突带来的容量损失进行具体计量,并利用改进的贪婪算法获得最优频谱感知序列。新的分布式算法和集中式算法,与传统方法进行比较时,可以获得更高的传输容量、更好的公平性和更低的冲突率。分布式算法由于不需要中心协调器,实现简单,算法复杂度低,且在信道空闲概率较低、误警率较高和信道数量较大的情况下,性能很接近集中式算法。最后本文讨论了多用户序贯频谱感知中的停止规则问题,给出了多用户情况下类似单用户的停止规则。发现在多用户情况下,将信道感知序列的设置和停止规则的设计分开的序贯频谱感知方法不是最优的,信道感知序列的设置和停止规则的设计应该在一个系统的角度进行联合优化。基于这种观察,本文提出了在线序贯频谱感知方法,该方法可以根据实时的感知结果和停止行为动态的调整信道感知序列,但是需要引入信息交互过程,不可避免的对网络传输容量造成不利影响。通过仿真实验发现,在信息交互时间相对信道探测时间较小时,在线序贯频谱感知方法的性能要优于集中式算法。最后研究了在没有信道统计信息的情况下,序贯频谱感知的设计方法。在没有信道统计信息的时候,认知用户需要花时间进行感知以获取这些信息,但同时又要利用已有的信息来为自己获得尽可能多的收益,多臂赌博机可以很好的解决这种exploration和exploitation的平衡问题。本文将信道感知排序和停止规则分开讨论,并且只考虑单用户网络。对于信道感知排序问题,由于信道排列种数太多,传统的置信区间(UCB1)方法的累积收益损失会成信道数的指数形式增长,收敛速度太慢。因此本文提出两种新的方法:虚拟采样的UCB1方法和基于UCB1指数的贪婪搜索算法。虚拟采样的UCB1方法充分考虑了不同信道排列间的相关性,使得用户的学习速度大大增加。基于UCB1指数的贪婪搜索算法直接从信道的角度出发,将UCB1方法融于贪婪搜索算法,使得用户的决策快速收敛于最优信道感知排序,其累积收益损失很快便不随时间的增加而增加。仿真实验表明虚拟采样的UCB1方法和基于UCB1指数的贪婪搜索算法的性能要优于传统文献中的方法。对于停止规则问题,本文考虑的是只有K种固定停止门限的简单情况。基于传统的UCB1方法,本文提出两种新的算法:虚拟采样方法和改进的UCB1指数方法。这里的虚拟采样方法与信道排序中的虚拟采样方法的原理一样,通过挖掘“臂”间的相关性增加用户的学习速度。改进的UCB1指数方法可以减少可选“臂”空间,从而增加算法的收敛速度。通过仿真实验证实两种新方法的累积收益损失都有明显的降低。