论文部分内容阅读
摘 要:介绍了认知无线电的物理层结构,提出了非博弈相对论在认知无线电中的一般分析方法。以最小化系统的总干扰水平为目标,借助引入新的代价函数构建了一种非合作博弈的功率控制模型,该模型能够对认知用户通过提高发射功率获得更大效益的行为进行惩罚,并通过对发射功率超过干扰温度的认知用户的严惩,使认知用户认识到牺牲一定的信干比可以带来整体效益的最优,从而避免了超过干扰温度后系统性能的迅速下降。
关键词:认知无线电;功率控制;非合作博弈;纳什均衡;效用函数
中图分类号:TN014文献标识码:A文章编号:1672-3198(2009)16-0265-02
0 前言
认知无线电(cognitive radio,CR)是以软件无线电(software radio)技术为基础的能够提高无线通信频谱利用率的新技术。在很多国家,传输效率较高的频段是以授权分配的方式分配给无线通信业务部门和运营企业的,但这些频段的授权用户并不是在任何时刻都使用分配给他的频段,因此不少传输效率很高的授权频段会经常处于空闲状态,这就浪费了宝贵的频谱资源。根据美国联邦通信委员会(FCC)所进行的大量研究表明,在大部分地区,授权频段的平均利用率在15%—85%之间,而一些传输效率较高的非授权频段则过于拥挤。于是Joseph Mitola博士在1999年首先提出了认知无线电概念,目的就是解决频谱资源的有效利用问题。
博弈论(Game Theory)又被称为对策论,是现代数学的一个分支,也是运筹学的一个重要组成部分,是研究互动决策的理论。John Nash博士在1950年提出了纳什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。该理论指出,在一策略组合中,所有的参与者都面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的,此时便达到了纳什均衡。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。这种参与者为了各自利益的最大化不断改变策略的做法,与CR中各认知用户为争得传输效率的最大化对频谱和功率不断进行调整的自适应算法策略相符。因此,可以引入非合作博弈论模型对CR的频谱分配和功率控制算法进行检测和优化。
本文以认知用户的满意度为设计目标,引入代价函数得到一种新的基于非合作认知无线电功率控制的博弈模型,并结合对该模型的分析介绍了非合作博弈论在CR中的一般分析方法。
1 认知无线电体系结构
认知无线电是对软件无线的扩展,因此具备软件无线可重新配置的特点,并且能够实现基于环境认知的自动配置。S•Haykin根据CR所必需的频谱扫描、信号分析、参数测量、频谱决策、协议分析等功能,给出了CR系统构成的基本功能结构,该结构将CR系统分为三个功能模块。
(1)无线频谱分析模块。
该模块通过接收环境中的射频激励,并利用自身算法对激励信号进行动态分析,实时提供对环境中频谱空穴的检测情况,搜集可使用的频谱空穴的信息。
(2)无线信道估计模块。
该模块根据无线频谱分析模块的分析结果,对无线信道状态和容量进行估计,为系统通信信道的选择提供依据。
(3)传输功率控制和动态频谱管理模块。
该模块根据频谱分析模块和信道估计模块的分析结果,选择最优的频谱空穴进行通信。在通信过程中对传输功率进行实时控制,使得首要用户和次要用户均能达到最优的通信水平。
S•Haykin给出的三个功能模块共同构成了CR系统的物理层,从各个模块所具备的功能可以看出认知无线电是应用了多种现代信号处理技术的综合性通信平台。
2 非合作博弈论在认知无线电中的分析方法
认知无线电中的策略选择问题及相关算法的设计是该技术的研究核心。利用非合作博弈论,可以按以下方法及步骤对自适应算法进行分析:
(1)该算法是否能达到纳什均衡。即验证算法是否能达到纳什均衡,具体步骤为:先将所研究的问题抽象为相应的非合作博弈算法模型,然后证明该模型中NE的存在性和唯一性。
(2)该算法达到纳什均衡(NE)后的稳定状态是否符合帕累托最优(Pareto Optimality)。即根据系统的目标函数衡量这一稳定状态是否是实际应用环境中的最优情况。
(3)该算法达到纳什均衡和帕累托最优的约束条件。
3 基于非合作博弈论的认知无线电功率控制模型
在认知无线电中,非授权用户接入处于空闲状态的授权用户频段,可以提高系统的频谱利用率,但是该接入过程必然会导致授权用户和非授权用户之间的干扰。这是由于在CR系统中通常采用动态功率控制以扩大通信系统的工作范围,而每个用户的发射功率都会对其他用户造成干扰。2003年,为了规范移动频段的非授权操作,美国联邦通信委员会(FCC)提出了新的量化和管理干扰的指标——干扰温度。在给定干扰温度和频谱空穴的限制下控制发射功率,可以看做为一组策略问题,而且在实际环境中很好的符合了非合作博弈的模型。在CR中,每个用户都从自身的利益出发,追求功率的最大化,而任何用户发射功率的增大都会对其他用户利益造成影响。因此需要提供一种有效的算法对各个用户的发射功率进行动态控制,以达到所有用户的总利益最大化。
在CR中可以用信道利用率、系统吞吐量、系统信干比等指标来衡量用户的利益。假设以系统信干比来衡量,设计算法时就应当以系统的总干扰水平最小化为设计目标。
通常把授权用户称为主要用户(Primary User),非授权用户称为次要用户(Secondary User)。假设通信环境中多个主要用户和次要用户同时工作,次要用户具有认知能力,即把次要用户看做认知用户。假设认知用户i的发射功率为pi,传输增益为gi,且认知用户与基站存在通信链路,基站接收到的该用户的功率为pigi,第j个主要用户对第i个次要用户的干扰为Qij并有M个主要用户,则相应的次要用户在基站处的信干比(SNIR)为:
ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)
其中σ2为基站处背景噪声,Ri为传输速率,W为第i个用户在的扩频带宽。
文献提出的非合作的认知无线电网络的功率控制纯策略的博弈模型(NPCG)定义了:参与者I={1,2,…,N}为认知网络中非授权用户的集合;策略空间pi,认知用户在一次博弈中选择的策略构成功率矢量P={p1,p2,…,pN};用 表示用户i的效用,即用户i对所选策略的满意程度,其中p-i是除i外其他N-1个用户的功率。
在该模型中,每个认知用户的策略都是尽量增大功率,以获得更高的效用。但当功率超过干扰温度后,整个系统的性能会迅速恶化,进而造成每个用户的效用都会降低。因此,必须选定合适的代价函数,使用户获得更高效用时付出相应的代价。考虑到在低于干扰温度时,用户只需付出较小的代价,而当超过干扰温度时,每增加一定的效用必须让用户付出更高昂的代价,笔者选择SINR的正切函数做为代价函数:
Ci=tg(kri)(2)
其中k为干扰系数,在认知用户发射功率接近干扰温度时,kri的取值接近π2 。
在非合作的认知无线电网络的功率控制纯策略的博弈模型的基础上,结合式(2)笔者提出基于非合作的功率控制算法的数学模型:
ui(pi,p-i)=Ripif(ri)-λpiritgri(3)
其中piri表示增加单位信干比所要增加的功率,λ为惩罚因子,代表代价函数有效性的量度。该模型通过引入代价函数增加了惩罚机制,以此来控制认知用户为追求信干比一味增大发射功率的行为。当功率超过干扰温度后的严厉惩罚,会使所有认知用户意识到,牺牲一定的信干比可以带来效用的最优,从而将发射功率控制在干扰温度以下,避免了超过干扰温度后系统性能迅速下降的恶性情况出现。
按照上节介绍的分析步骤对式(3)给出的模型进行分析,讨论该模型是否存在纳什均衡(NE)以及是否符合帕累托最优。对式(3)求一阶导数后可求得微分方程的驻点,进而再求出二阶导数,易证式(3)的二阶导数小于零。因此可得出该非合作博弈过程中NE的存在性和唯一性,所求得的驻点为唯一的纳什均衡点,同时该驻点即为所应满足的约束条件。
4 结论
认知无线电概念提出的20年以来,随着相关技术的研究不断深入、相关传输标准的确立以及计算机处理能力的提高,CR的应用越来越广泛。本文首先介绍了CR物理层的基本结构,然后结合一种新的基于NPCG的非合作非合作功率控制模型的构建,介绍了非合作博弈论在认知无线电中的分析方法。综上所述,我们有理由相信,随着相关理论和技术的不断进步,非合作博弈论必将在认知无线电的功率分配、频谱分配以及其他核心研究方向发挥更大的作用。
参考文献
[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.
[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.
[3]Shah V , Mandayam N B , Goodman D J . Power Cont rol for Wireless Data Based on Utility and Pricing[J]. Indoor and Mobile Radio Communications , 1998,3(8):1427-1432.
[4]Mitola J , Maguire G Q.Cognitive Radio:Making Sof tware Radios More Personal [J]. IEEE Personal Communications ,1999,6 (4):13-18.
关键词:认知无线电;功率控制;非合作博弈;纳什均衡;效用函数
中图分类号:TN014文献标识码:A文章编号:1672-3198(2009)16-0265-02
0 前言
认知无线电(cognitive radio,CR)是以软件无线电(software radio)技术为基础的能够提高无线通信频谱利用率的新技术。在很多国家,传输效率较高的频段是以授权分配的方式分配给无线通信业务部门和运营企业的,但这些频段的授权用户并不是在任何时刻都使用分配给他的频段,因此不少传输效率很高的授权频段会经常处于空闲状态,这就浪费了宝贵的频谱资源。根据美国联邦通信委员会(FCC)所进行的大量研究表明,在大部分地区,授权频段的平均利用率在15%—85%之间,而一些传输效率较高的非授权频段则过于拥挤。于是Joseph Mitola博士在1999年首先提出了认知无线电概念,目的就是解决频谱资源的有效利用问题。
博弈论(Game Theory)又被称为对策论,是现代数学的一个分支,也是运筹学的一个重要组成部分,是研究互动决策的理论。John Nash博士在1950年提出了纳什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。该理论指出,在一策略组合中,所有的参与者都面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的,此时便达到了纳什均衡。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。这种参与者为了各自利益的最大化不断改变策略的做法,与CR中各认知用户为争得传输效率的最大化对频谱和功率不断进行调整的自适应算法策略相符。因此,可以引入非合作博弈论模型对CR的频谱分配和功率控制算法进行检测和优化。
本文以认知用户的满意度为设计目标,引入代价函数得到一种新的基于非合作认知无线电功率控制的博弈模型,并结合对该模型的分析介绍了非合作博弈论在CR中的一般分析方法。
1 认知无线电体系结构
认知无线电是对软件无线的扩展,因此具备软件无线可重新配置的特点,并且能够实现基于环境认知的自动配置。S•Haykin根据CR所必需的频谱扫描、信号分析、参数测量、频谱决策、协议分析等功能,给出了CR系统构成的基本功能结构,该结构将CR系统分为三个功能模块。
(1)无线频谱分析模块。
该模块通过接收环境中的射频激励,并利用自身算法对激励信号进行动态分析,实时提供对环境中频谱空穴的检测情况,搜集可使用的频谱空穴的信息。
(2)无线信道估计模块。
该模块根据无线频谱分析模块的分析结果,对无线信道状态和容量进行估计,为系统通信信道的选择提供依据。
(3)传输功率控制和动态频谱管理模块。
该模块根据频谱分析模块和信道估计模块的分析结果,选择最优的频谱空穴进行通信。在通信过程中对传输功率进行实时控制,使得首要用户和次要用户均能达到最优的通信水平。
S•Haykin给出的三个功能模块共同构成了CR系统的物理层,从各个模块所具备的功能可以看出认知无线电是应用了多种现代信号处理技术的综合性通信平台。
2 非合作博弈论在认知无线电中的分析方法
认知无线电中的策略选择问题及相关算法的设计是该技术的研究核心。利用非合作博弈论,可以按以下方法及步骤对自适应算法进行分析:
(1)该算法是否能达到纳什均衡。即验证算法是否能达到纳什均衡,具体步骤为:先将所研究的问题抽象为相应的非合作博弈算法模型,然后证明该模型中NE的存在性和唯一性。
(2)该算法达到纳什均衡(NE)后的稳定状态是否符合帕累托最优(Pareto Optimality)。即根据系统的目标函数衡量这一稳定状态是否是实际应用环境中的最优情况。
(3)该算法达到纳什均衡和帕累托最优的约束条件。
3 基于非合作博弈论的认知无线电功率控制模型
在认知无线电中,非授权用户接入处于空闲状态的授权用户频段,可以提高系统的频谱利用率,但是该接入过程必然会导致授权用户和非授权用户之间的干扰。这是由于在CR系统中通常采用动态功率控制以扩大通信系统的工作范围,而每个用户的发射功率都会对其他用户造成干扰。2003年,为了规范移动频段的非授权操作,美国联邦通信委员会(FCC)提出了新的量化和管理干扰的指标——干扰温度。在给定干扰温度和频谱空穴的限制下控制发射功率,可以看做为一组策略问题,而且在实际环境中很好的符合了非合作博弈的模型。在CR中,每个用户都从自身的利益出发,追求功率的最大化,而任何用户发射功率的增大都会对其他用户利益造成影响。因此需要提供一种有效的算法对各个用户的发射功率进行动态控制,以达到所有用户的总利益最大化。
在CR中可以用信道利用率、系统吞吐量、系统信干比等指标来衡量用户的利益。假设以系统信干比来衡量,设计算法时就应当以系统的总干扰水平最小化为设计目标。
通常把授权用户称为主要用户(Primary User),非授权用户称为次要用户(Secondary User)。假设通信环境中多个主要用户和次要用户同时工作,次要用户具有认知能力,即把次要用户看做认知用户。假设认知用户i的发射功率为pi,传输增益为gi,且认知用户与基站存在通信链路,基站接收到的该用户的功率为pigi,第j个主要用户对第i个次要用户的干扰为Qij并有M个主要用户,则相应的次要用户在基站处的信干比(SNIR)为:
ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)
其中σ2为基站处背景噪声,Ri为传输速率,W为第i个用户在的扩频带宽。
文献提出的非合作的认知无线电网络的功率控制纯策略的博弈模型(NPCG)定义了:参与者I={1,2,…,N}为认知网络中非授权用户的集合;策略空间pi,认知用户在一次博弈中选择的策略构成功率矢量P={p1,p2,…,pN};用 表示用户i的效用,即用户i对所选策略的满意程度,其中p-i是除i外其他N-1个用户的功率。
在该模型中,每个认知用户的策略都是尽量增大功率,以获得更高的效用。但当功率超过干扰温度后,整个系统的性能会迅速恶化,进而造成每个用户的效用都会降低。因此,必须选定合适的代价函数,使用户获得更高效用时付出相应的代价。考虑到在低于干扰温度时,用户只需付出较小的代价,而当超过干扰温度时,每增加一定的效用必须让用户付出更高昂的代价,笔者选择SINR的正切函数做为代价函数:
Ci=tg(kri)(2)
其中k为干扰系数,在认知用户发射功率接近干扰温度时,kri的取值接近π2 。
在非合作的认知无线电网络的功率控制纯策略的博弈模型的基础上,结合式(2)笔者提出基于非合作的功率控制算法的数学模型:
ui(pi,p-i)=Ripif(ri)-λpiritgri(3)
其中piri表示增加单位信干比所要增加的功率,λ为惩罚因子,代表代价函数有效性的量度。该模型通过引入代价函数增加了惩罚机制,以此来控制认知用户为追求信干比一味增大发射功率的行为。当功率超过干扰温度后的严厉惩罚,会使所有认知用户意识到,牺牲一定的信干比可以带来效用的最优,从而将发射功率控制在干扰温度以下,避免了超过干扰温度后系统性能迅速下降的恶性情况出现。
按照上节介绍的分析步骤对式(3)给出的模型进行分析,讨论该模型是否存在纳什均衡(NE)以及是否符合帕累托最优。对式(3)求一阶导数后可求得微分方程的驻点,进而再求出二阶导数,易证式(3)的二阶导数小于零。因此可得出该非合作博弈过程中NE的存在性和唯一性,所求得的驻点为唯一的纳什均衡点,同时该驻点即为所应满足的约束条件。
4 结论
认知无线电概念提出的20年以来,随着相关技术的研究不断深入、相关传输标准的确立以及计算机处理能力的提高,CR的应用越来越广泛。本文首先介绍了CR物理层的基本结构,然后结合一种新的基于NPCG的非合作非合作功率控制模型的构建,介绍了非合作博弈论在认知无线电中的分析方法。综上所述,我们有理由相信,随着相关理论和技术的不断进步,非合作博弈论必将在认知无线电的功率分配、频谱分配以及其他核心研究方向发挥更大的作用。
参考文献
[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.
[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.
[3]Shah V , Mandayam N B , Goodman D J . Power Cont rol for Wireless Data Based on Utility and Pricing[J]. Indoor and Mobile Radio Communications , 1998,3(8):1427-1432.
[4]Mitola J , Maguire G Q.Cognitive Radio:Making Sof tware Radios More Personal [J]. IEEE Personal Communications ,1999,6 (4):13-18.