论文部分内容阅读
物联网(Internet of Things,IoT)技术彻底改变了无线传感网络,在当今时代真正实现了万物互联的普及通信。但遗憾的是,随着IoT设备数量的与日俱增,现有的物联网技术受到了频谱规模的限制,大规模的用户无法重复使用授权频段,而在资源充沛的非授权频段却没有一个覆盖能力完全达到大规模物联网可以使用的技术,所以探究基于非授权频段且具有良好覆盖性能的物联网系统是解决大规模物联网用户接入的重要途径。随着IoT用户数量的增加以及应用场景的复杂化,物联网用户的资源分配问题也成为了解决大规模IoT设备接入的另一个难题。第五代移动通信系统(The 5th Generation mobile communication system,5G)提出要在提高系统容量的同时以用户为中心。而传统的资源分配算法是从提高业务准确性和质量的角度提高用户的体验质量(Quality of Experience,QoE),运营商的优化往往是以网络为中心,这样的解决方法并不能充分保证用户QoE,并且随着用户接入场景的更加多样,优化服务质量的传统资源分配算法并不能灵活的应对更加复杂的场景。因此,基于用户体验的无线资源分配研究具有重要意义。本文针对大规模IoT设备接入进行了两个方面的研究,第一:设计了一种基于非授权频段的窄带物联网通信系统(Unlicensed Narrowband Internet of Things,U-NB-IoT),从物理层的角度达到增强覆盖范围和降低能耗。第二:针对大规模物联网场景,提出了一种基于深度强化学习的集中式资源分配算法,该算法在满足链路干扰约束的同时最大化用户体验。本文主要内容以及创新点如下:第一,与传统的窄带物联网(Narrowband Internet of Things,NB-IoT)不同,本文设计了一种基于非授权频段的FDMA的时分双工(Time Division Duplex,TDD)系统,并且给出了系统的下行设计细节,包括信道设计,帧结构和基带处理等。第二,本文更加具体的提出了下行数据信道和同步信道的发送以及接收的若干方案,并且通过方案对比验证了同步和数据链路的性能,进一步改善了覆盖性能。第三,针对大规模物联网场景,本文提出了一种基于深度强化学习的集中式资源分配算法,满足链路干扰约束。第四,不同于以优化服务质量(Quality of Service,QoS)为目标的传统的资源分配算法,本文研究最大化用户体验,通过基于效用的平均意见得分(Mean Opinion Score,MOS)对QoE进行测量。相比于传统的强化学习算法,本文利用了一种演员评论家(Actor-Critic,AC)的强化学习框架克服了传统强化学习算法无法实现的连续功率分配问题。仿真结果表明,本文提出的算法在不同条件下具有稳定的收敛性以及良好的QoE水平。