论文部分内容阅读
自组织(Adhoc)网是一种灵活的多跳自治系统,非常适用于无人机通信、车联网、环境监测、智能家居等网络场景,自组织网MAC(Medium Access Control)协议受到广泛关注和研究。研究表明,基于TDMA(Time Division Multiple Access)方式的MAC协议在自组织网协议实现方式中通常具有良好的网络性能表现,是主要的实现方式之一。当前复杂应用场景的需求日益增多,特别是在实用性和优化信道资源分配方面的问题,对自组织网MAC协议性能提出了巨大挑战。当前自组织网中竞争预约算法研究已较成熟,算法性能提升遇到一定瓶颈,需寻求不同的解决思路。随着人工智能技术的快速发展和成熟,其中的增强学习技术能实现智能体自主学习策略以寻求到达对应优化目标的效果,如何将增强学习技术与通信领域相结合,提供了一种新的MAC协议优化解决思路。因此,本文在TDMA-MAC协议设计并与增强学习技术相结合的方向展开主要研究工作。首先,针对 E-TDMA(Evolutionary-TDMA)和 FPRP(Five-Phase Reservation Protocol)等协议存在的对物理设备性能要求较高的实用性问题和预约过程复杂等问题,本文提出一种改进的ME-TDMA(Multicycle enhanced TDMA)协议。该协议通过时隙交织技术,能保证物理设备有充足的处理时间,对物理设备在传输、处理以及分析分组的时延性能要求更低,更适合应用于实际网络场景。为了减少协议控制交互流程的复杂度,ME-TDMA协议采用多周期预约机制,从而降低控制开销,提升信道利用率。此外,考虑到节点发送缓存区有限,本文提出的基于负载的分配机制能减小缓存溢出造成丢包的可能性。本文提出的ME-TDMA比FPRP、E-TDMA在传输带宽、传输时延、丢包率方面的网络性能的优化效果更好。其次,为了提高FPRP信道竞争预约成功率,本文在考虑FPRP接入协议的特性上,利用增强学习技术的自适应学习特性,提出基于DQN的竞争p值调整算法,DQN-FPRP算法。设计学习模型探索学习调整p值的策略,生成p值调整的更优方案,从而减少竞争冲突和提高信道利用率。最后仿真结果表明,相对于传统竞争退避算法和多跳随机贝叶斯算法,DQN-FPRP在竞争成功率、传输速率等方面具有更高的性能优势。最后,E-TDMA、ME-TDMA等协议广播控制信息时会一次性预约多个时隙,而且存在预约冲突,需研究一种多时隙分配策略,以提高时隙分配效率。在这种多时隙预约场景中,每个节点需预约的时隙数量和在不同预约时隙上可参与预约的节点数量都存在差异性,这两种差异性将导致不同时隙的竞争预约情况不同。本文创新性地从这两种差异性切入,并结合增强学习算法,提出基于DDPG的多时隙分配算法。仿真结果表明该算法对ME-TDMA协议的预约效率、传输时延、传输速率、丢包率等性能有更好的优化效果。