论文部分内容阅读
近年来,随着无人机技术的发展,无人机的应用范围越来越广泛,现已广泛应用于航拍、信息采集等领域。在无线通信领域,无人机也被视为未来无线通信网络中的一个重要承载形式。得益于其体积小、灵活性高等特点,搭载基站的无人机在一些特殊场景中被看作是有效解决通信问题的途径,例如灾后的通信恢复、短时大规模集会应急通信等。为了充分利用无人机的机动性特点,无人机的静态部署位置以及其动态轨迹优化是一个重要的研究内容。围绕此研究内容,本文对三个问题进行了研究。首先,针对无人机最优部署高度难以确定的问题,本文分别对二维部署和三维部署中无人机部署高度与性能的关系进行了分析,为设置无人机的部署高度提供了参考。在无人机的部署问题中,部署高度是影响系统性能的一个重要因素。在二维部署的场景中,本文利用随机几何的方法,从统计角度对多无人机系统进行分析,给出了统计意义下有限多无人机网络中无人机搭载定向天线时部署高度和系统性能的关系,并推广到全向天线的情况。对于在三维空间中部署的场景,以经典强化学习算法为例,分析了三维部署时探索高度范围对服务质量和收敛速度的影响。然后,针对考虑用户移动性的无人机轨迹优化问题,本文提出了一种在连续动作空间中选取动作的无人机轨迹优化算法,并给出了一种加强算法泛化性的训练方法,达到了提升系统性能,增强算法通用性的效果。当地面用户移动时,无人机根据地面用户的移动调整其位置可以提供更好的服务。在这样动态性强的场景中,无人机基站的轨迹优化是一类非常复杂的问题。基于深度强化学习框架,本文将无人机抽象为强化学习中的智能体,提出了一种考虑用户移动的无人机轨迹优化算法。进一步,针对用户移动路径不确定的问题,本文给出了一种加强算法泛化性能的训练方法,该训练方法使提出的轨迹优化算法可以适应用户移动特性的改变,使得算法更加通用,便于快速使用。最后,针对多无人机基站网络中的轨迹优化问题,本文提出了一种仅根据局部信息做出决策的轨迹优化算法,避免了无人机之间的决策信息同步过程,减小了无人机故障时对其他无人机决策的影响。在多无人机网络中进行无人机的轨迹优化且各无人机之间有影响时,为保证系统的稳定,需要在各无人机之间进行决策信息同步,无人机之间决策信息同步会带来额外的时延,且故障无人机会对其他无人机的决策造成影响。为免去无人机之间动作信息的同步,减小无人机之间的决策影响,本文将整个问题建模为一个部分观测马尔可夫多智能体问题,基于多智能体强化学习算法,提出了一种多无人机基站轨迹优化算法。每个无人机只需根据局部信息进行决策,从而避免了无人机之间的动作信息同步,减小了无人机之间决策的影响。