基于深度强化学习的无人机基站布局与追踪覆盖研究

来源 :邱瑾 | 被引量 : 0次 | 上传用户:xingsen777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
突发性公共事件如地震、洪水等自然灾害的频发,会导致受灾范围内的通信设施损坏,灾区民众和救援人员的通信信号被阻断,救援工作实施艰难,从而造成重大的人员伤亡和财产损失。在应急通信系统中,无人机可以作为空中基站来协助地面基础设施在各种紧急情况下保持无线连接:灾区中的地面基站设施容易遭到损坏,可以将无人机作为空中通信平台,协助或替代地面蜂窝网络对终端用户进行网络覆盖;此外,在重大体育赛事或演出赛事中,地面基站容易工作过载,不能满足大量用户的通信需求,无人机可以作为空中基站为地面基站进行辅助分流,为更多用户提供高质量的通信服务。在有限范围内通过联合部署多个无人机基站来最大化N个地面用户的覆盖率,是一个NP-hard的问题,其复杂度随着N的增大呈指数增加。当考虑特定场景中建筑物的遮挡时,无人机的覆盖范围将呈现不规则的形状,覆盖问题将变得更加复杂。为了解决这个难题,本文采用了深度强化学习(Deep Reinforcement Learning,DRL)方法:(1)提出覆盖位图来表示状态,以刻画无人机和用户之间的空间相关性,且覆盖位图的大小和神经网络输入的复杂度是恒定的,能够有效地避免维度灾难;(2)结合通信领域知识设计动作和奖励,使智能体在与复杂传播环境之间的动态交互中能够有效地学习。具体而言,本文提出了一种新颖的两步设计方法,该方法包括基于视线传输(Line of Sight,LoS)信道模型的初步设计,以及根据特定场景视线/非视线(Non-LoS,NLoS)信道来进一步完善无人机方位的改良设计,并使用DQN和Prioritized Replay Double-DQN(PRDDQN)算法来训练多无人机部署决策的策略。实验结果表明,与K-means算法相比,所使用的方法可以显著提高在复杂环境下的覆盖率。在无人机基站布局优化研究的基础上,本文进一步研究无人机自适应追踪覆盖移动用户的问题,并使用改进的PRDDQN方法使无人机能够在有限的时间内追踪并重新覆盖移动的用户。
其他文献
大规模多输入多输出(Multi-Input-Multi-Output,MIMO)作为新一代无线通信网络的关键技术,可有效提高数据传输速率和频谱资源利用率。信道估计的准确性直接影响大规模MIMO通信系统的性能。受大规模MIMO系统天线规模显著增大的影响,传统信道估计方法具备较高的计算复杂度,且需耗费较多时频资源,导致大规模MIMO系统的频谱效率受到限制。如何在保证频谱效率的同时提升大规模MIMO信道
学位
重叠向来是汉语语法研究的一个重要课题。自上世纪五十年代以来,汉语重叠研究层出不穷,从重叠的形式、意义到重叠的机制与动因,重叠研究正逐渐走向深入。方言重叠研究也不在少数,且与共同语重叠相比,方言重叠往往具备自己的特点。在这样的背景之下,本文对梧州白话的形容词重叠式进行描写和分析,以充实汉语方言重叠研究,尝试为挖掘汉语重叠特点提供更多可能性。本文共分五章。第一章绪论,主要介绍方言点梧州的人文地理和历史
学位
肿瘤、创伤等引起的骨缺损是临床常见病症,随着我国人口老龄化的加剧,骨缺损发生率呈现增高趋势,目前临床治疗主要以骨移植为主,但其存在免疫排异、感染、骨不连等问题。骨组织工程是被认为最有前景的骨缺损修复策略;与传统的自体移植和异体移植相比,既不会对受体造成额外创伤,又减少了感染以及受体排斥等风险。然而,血管化不足已成为骨修复中的一个严重问题。在大块骨组织损伤修复过程中,损伤部位的血管新生情况决定了其损
学位
多线激光雷达得到的点云数据能够提供丰富的细节和深度信息,并且随着深度学习技术的快速发展,基于其的场景理解任务包括语义分割、目标检测、三维重建、点云配准等受到越来越多的关注,并已广泛应用于自动驾驶和场景重建任务中。大规模城市道路点云场景中的同类目标可能存在明显的大跨度空间相关性,例如路灯每隔几十米出现一次。这种空间相关性对于目标判定可能起着决定性的作用。本文从这一点出发以城市道路路灯为例对来捕获这种
学位
随着通信技术与计算机应用的发展,车联网(Internet of Vehicles,IoV)应运而生。车联网中存在着庞大的任务处理需求,计算卸载技术由此被引入,以提高任务的处理能力与执行效率。学术界通过设计卸载策略以降低能量消耗或减少任务执行成本。然而这些策略常忽视任务的内部特性,或假设对应的移动边缘计算(Mobile Edge Computing,MEC)服务器资源属性单一,也缺乏对任务积压情况的
学位
近年来高速运动微弱目标频现,该类目标机动性强、不易被探测,回波信号信噪比普遍较低,传统信号处理方式已不适用。脉冲积累是处理微弱目标的常用算法,但高速运动给积累带来了距离走动及速度模糊等问题,极大地影响了该类目标的高精度参数估计。目标运动参数估计是实现雷达定位、追踪等功能的基础,因此本文以线性调频(Linear Frequency Modulation,LFM)信号为基础,围绕高速运动微弱目标参数估
学位
近年来,随着互联网应用的飞速发展,无线通信系统对高数据速率的需求不断增加,导致授权频谱负载压力剧增。然而,由于可用授权频段的物理范围有限,新的授权频段变得稀少且昂贵。因此在非授权频段上部署LTE(Long Term Evolution)已经成为缓解授权频谱紧缺的一种新方案。为此第三代合作伙伴组织(3rd Generation Partnership Project,3GPP)提出 了授权频谱辅助接
学位
机场跑道异物(Foreign Object Debris,FOD)的存在是飞机安全的一大隐患,不仅造成巨大的经济损失,更重要的是可能危及生命安全。因此,做好FOD防范具有重大的安全意义,而FOD检测是防范FOD的常用措施之一。FOD检测技术主要解决强地杂波下的微弱静止目标的检测,本文以FOD检测为研究背景,首先对四种雷达杂波模型进行建模,主要研究基于雷达的FOD检测算法,分别从时域和空域两个方面提
学位
水管是组成城市供水系统和隔水管道的基本单元,利用水管可实现水声通信和支持水下管道物联网等应用。基于浅海的几何水声信道模型能够在低复杂度的基础上模拟水管通信特性。但水管环境不同于海洋,在水质、噪声以及信道物理结构均有差异,现有的几何水声信道模型无法真实的模拟水管水声特性。同时,常用信道估计方法消除多径效应的能力较弱,导致接收机在精度和效果上表现不佳。因此,本文提出适用于水管水声环境下的信道建模和估计
学位
合成孔径雷达(SAR)广泛应用于军事等各领域,SAR图像的目标识别具有研究与实际应用价值。然而SAR图像目标识别技术虽经过多年研究取得了一定成就,但在复杂的实战环境下,仍会因SAR图像的数据分布和应用特点受到很大的限制。在实际应用中,受不确定环境的影响,缺少足够的采样率和驻留时间获取相应目标的大量样本,对于非合作目标的数据获取就更难,这导致数据变化较为单一,非合作目标数量较少,这使得数据呈现长尾分
学位