论文部分内容阅读
在移动互联网时代,用户越来越迫切需要随时随地的无缝接入无线网络。异构无线网络的融合为此提供了可能。为了尽可能为用户提供总是最优的服务,无线接入网络必须能够实现动态选择。另外,由于用户数量的爆炸式增长,移动互联网产业消耗能量越来越高,严重影响了自然环境并增加运营商的运维成本。因此,非常有必要在异构无线网络中研究如何提升能量效率。 本论文提出异构无线网络中基于能量效率的动态网络选择机制.在无线网络选择中考虑数据传输的能量消耗,实现基于能量效率的网络选择。应用演化博弈理论对用户的网络选择过程建模,用演化博弈的复制动态方程表示用户之间不断博弈和演化的过程,然后根据复制动态得到演化博弈的均衡点,根据非线性系统的稳定原理得到网络选择的稳定策略。 通过改进的Q-Learning算法实现了用户网络选择的演化博弈过程,把用户选择网络的过程模拟为多智能体的Markov决策过程,解决了基础Q-Learning算法在多智能体条件下难以收敛的问题。 通过实验对用户的网络选择和改进Q-Learning算法进行了仿真,仿真结果描述了用户网络选择的演化过程,证明了基于能量效率的网络选择方法相对于传统网络选择方法对能量效率有较大的提升。仿真实验对改进Q-Learning算法的收敛性进行了验证,分析了用户通过Q-Learning算法作网络选择过程中收益的震荡过程。