论文部分内容阅读
大规模天线阵列(massive multiple input multiple output,massive MIMO)波束赋形技术是第五代移动通信系统(5th generation,5G)物理层的关键技术,也是未来无线通信系统的支撑性技术。作为大幅度提升无线通信系统物理层性能的重要手段,massive MIMO波束赋形技术的研究既是信息与通信工程学科学术研究的重要方向,也是无线通信产业重点关注的研究方向。随着5G标准化进程的不断推进以及无线通信理论的快速发展,massive MIMO波束赋形技术己成为研究热点,具有较高的研究价值。本文围绕massive MIMO波束赋形技术开展研究。首先考察信号模型与信道建模,考虑到massive MIMO物理层无线信道的特殊性,由于传统无线通信研究所使用的信道模型难以精确刻画massive MIMO无线信道,因而需要基于新型信道模型研究波束赋形技术。另外,无线多播(wireless multicast)波束赋形技术相比传统波束赋形技术可以成倍提升频谱效率和能源效率,但针对该技术在5G场景下的研究尚未深入。针对这些问题,首先采用massive MIMO互阻抗信道模型进行信道建模,采用无线多播与线性预编码(linear precoding)复合型波束赋形传输方案,推导出信号模型并给出优化目标,再利用massive MIMO的渐进分析结果给出渐进最优波束赋形方案。随后,针对多用户干扰问题,采用零空间干扰消除技术对波束赋形信号进行预处理。针对所提出的massive MIMO复合型波束赋形传输系统,搭建仿真平台并给出不同波束赋形方案和不同信道模型的性能对比。其主要创新点在于,使用了massive MIMO互阻抗模型建立了信道模型,结合零空间干扰消除技术建立了复合型波束赋形传输系统并进行了仿真分析,为后续研究提供基础的系统模型和初步的研究结论。进一步,考虑到massive MIMO波束赋形传输系统受限于信道估计不精确等问题而影响预编码技术的性能,针对物理层点对点的数据传输模型,建立了基于大规模马尔可夫决策过程(Markov decision process,MDP)模型和强化学习模型的系统模型,以传统的凸优化建模方法为出发点,围绕massive MIMO波束赋形最优策略进行建模,给出了平均回报准则下的抽象调度问题。基于该问题,研究了基于MDP的波束赋形调度问题与原问题的等价性及其最优解的存在性,并推导出无线多播波束赋形技术的等价调度问题;进一步利用massive MIMO的渐进特性进行分析,将该调度问题分解为一系列MDP子问题,建立了部分观测的MDP调度子问题并给出了策略估计方法;最后利用强化学习的策略梯度定理给出了求解该调度问题的算法。基于上述理论框架,又将研究成果扩展到考虑物理层安全的massive MIMO波束赋形系统中,以保密容量作为优化目标,结合人工噪声成型和波束赋形等技术给出信号模型和优化目标,然后使用前述基于MDP和强化学习的分析方法建立了调度问题,并结合massive MIMO渐进特性进行分析,推导出基于MDP和强化学习的物理层安全子问题。仿真结果给出了在不观测信道状态的情况下,使用强化学习算法求解的最优波束赋形策略与随机策略的性能对比。结果表明,使用强化学习求解得出的波束赋形方案的性能在不同天线场景下均能超过随机波束赋形方案,从而证明了该方法的合理性。其主要创新点在于,将MDP与强化学习理论应用到massive MIMO波束赋形技术及物理层安全技术中,给出了基于强化学习的波束赋形优化算法并进行了仿真分析,该方法不会受到信道估计不精确带来影响,可以作为传统的基于凸优化理论的信号处理方法的补充。最后,考虑系统级别的massive MIMO波束赋形技术,研究了多小区场景下的用户调度问题。基于massive MIMO波束赋形技术给出了信号模型和移动性模型并利用渐进特性对模型进行了分析,建立了高维并具有对称性的大规模MDP问题对massive MIMO波束赋形系统的用户调度问题进行建模。考虑到异构系统小区重选场景,还提出了基于MDP的异构系统用户调度模型。进一步,针对大规模MDP问题难以有效求解的问题,考虑上述大规模MDP问题中存在的对称性,提出了对称多智能体强化学习(multi-agent reinforcement learning,MARL)理论,给出了对称MARL问题的定义和三类对称性条件;针对所提出的强对称MARL问题,提出了利用MARL子问题策略进行策略估计的方法,并对策略估计误差进行了理论分析。基于该套理论并应用在前述模型中,提出了基于对称MARL问题的用户调度问题及其子问题,基于对称MARL理论给出了低复杂度的求解算法。针对不同场景的用户调度问题给出了仿真结果和分析,针对MARL问题给出了策略估计误差的仿真结果。其主要创新点在于,结合massive MMO波束赋形系统建立了用户调度模型,提出了对称MARL理论及其策略估计误差分析理论,提出了基于对称MARL理论的用户调度模型,并对上述模型进行仿真验证。