无线电地图辅助下基于深度强化学习的无人机路径规划

来源 :南昌大学 | 被引量 : 0次 | 上传用户：gz_firefox

【摘要】

：

【作者】

：

喻林

【机构】

：

南昌大学

【出处】

：

南昌大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

得益于无人机的低成本和灵活移动性,无人机已经被应用于各类复杂通信场景。传统的无人机通信轨迹规划都是将问题进行人工数学建模后进行优化求解,常假设信道模型为简单的视距链路（Lo S）或者概率Lo S,获得关于无人机位置的函数表达式后,再用凸优化技术进行路径规划。由于信道的时变性和无人机的移动性,传统的建模和描述过于简单,获得的轨迹无法指导无人机的实际应用。深度强化学习是一种在复杂的动态环境中进行最优决策的方法。在动态的低空网络中,对无人机轨迹和资源等参数进行优化,实际上就是一个动态环境中的最优决策问题,与深度强化学习的目标相契合。因此,本文抛弃了传统的基于建模的求解方法,采用DRL构建低空网络的信道环境,生成无线电地图,然后利用无线电地图辅助无人机轨迹优化。如何利用无人机的机动性去更高效的构建无线电地图并完成通信任务,是一个值得研究的问题。本文致力于探究基于深度强化学习算法无人机轨迹优化策略,具体的研究工作如下:一、考虑一个地面蜂窝网络连接的无人机通信场景,通过地面基站实现对无人机的控制,为无人机设计轨迹实现任务完成时间的最小化。为确保安全,需要尽可能地保证无人机与地面网络的连接可靠性。而考虑到低空中基站的覆盖存在覆盖黑洞这一现实情况,我们针对连接约束提出了两种不同的度量标准,基于这两种标准制定了无人机的飞行时间最小化问题。第一,在飞行过程中,无人机单次中断的时间小于一个设定的阈值。第二,无人机的多次中断的累积时间不超过给定的阈值。我们提出了一种基于Dueling DDQN的多步学习算法,将飞行时间最短建模为马尔科夫决策问题,合理地设计强化学习基本元素:状态空间、动作空间以及奖励函数,仿真结果证明了所设计的深度强化学习算法的有效性,能够很好地解决移动感知轨迹设计问题。二、面向无人机无线供能通信网络的场景,无人机给地面设备供能同时接收基站发送的数据,研究联合无人机总能量传输最大化、总数据吞吐量最大化以及能耗最小化问题,提出无人机飞行轨迹设计和飞行策略优化。我们使用了改善的DDPG算法来获得无人机的控制策略,将动态的无线功能网络问题转化为马尔科夫序列决策问题,并设置多维的奖励函数对应着上述三个优化目标,数值结果验证了DDPG算法的有效性,能够优化路径以较小的能耗供应更多的能量同时接收更多数据。与提出的最大速度和最节能速度两个基准方案相比,DDPG算法能够得到最优的策略。

其他文献

基于射线追踪法的室内可见光通信系统信道建模方法研究

6G将全面实现物联世界的数字化,以可见光、射频等多种介质融合的通信感知一体化技术是6G的核心关键技术之一。室内作为信息产业及数字经济绝大部分连接的产生场景,是6G最核心的应用场景,因此,基于可见光等介质融合的通信感知一体化技术必须解决好室内可见光复杂传播环境相关的问题。本文将重点聚焦于高精度、低复杂度的室内可见光通信信道建模,以全面、准确、实时地刻画室内可见光传输路径的空间、时间、功率分布,从而形

学位

基于卷积核变换及匹配距离融合的指节纹识别研究

生物特征识别（人脸、指纹、掌纹等模态）是一种新型的、极具发展前景的身份认证方式。与其它模态相比,指节纹（Finger-knuckle-print,FKP）具有丰富鉴别特征,不易磨损,用户接受性强,获取成本低等优势,逐渐成为近年的主流研究对象之一。同时,编码类指节纹识别算法具有无需训练,存储量低,匹配速度快等特点,也成为了一种重要的实用性技术。现有的编码类指节纹识别研究中存在着以下两个问题。问题一,

学位

面向未知环境的多机器人同时定位与地图构建研究

多个自主导航机器人协作探索地图,是在未知环境中高效率执行危险且繁杂任务的基础。单个机器人传感器探测范围、通信连接、电源功率等都受到限制。在大尺度、复杂未知环境中。装备摄像机、激光雷达等多种探测传感器的机器人群体通过共享信息,高效协作完成探测二维和三维地图或模型面。协作可以缩短搜索时间,同时在提高模型完整性和准确性方面也具备很大的潜力。面向传感器和通信连接受限的机器人群体,下一步最佳视点规划和传感器

学位

基于多传感器的无人机室内自主导航研究

无人机因其轻巧灵敏和安全可靠等优势,在室外获得了广泛的应用,如航拍摄影、农田灌溉、电力巡检等等。相比室外,无人机在室内的应用受到极大限制,究其原因不外乎所依赖的卫星导航系统在室内信号受限。针对无人机在室内应用受限问题,仅依靠自身搭载的传感器来完成在室内或未知环境下的飞行探索已经成为一个研究热点。基于上述背景,本文以四旋翼无人机为平台,结合双目视觉传感器并融合惯性测量单元,搭载机载计算机和激光雷达,

学位

基于注意力机制的光子计数单像素成像技术研究

光子计数单像素成像将光子计数技术和基于压缩感知的单像素成像结合,具有高灵敏、低成本的优势,在光学遥感成像、光谱成像、生物医学成像等领域有重要的应用。传统的重建算法存在采样时间和重建时间长的问题,近年来将深度学习用于压缩感知重建取得了重大的突破。基于深度学习的压缩采样和重建网络,将去除偏置和激活函数的全连接层作为测量矩阵,避免了传统迭代算法的带来的巨大计算量,从而实现了更快更高质量的图像重建。但利用

学位

基于纠缠态的半量子密钥分配协议

作为量子密码学的一个重要研究方向,量子密钥分配旨在实现合法通信参与者之间安全地共享密钥。量子密钥分配协议一般要求所有通信参与者都具备量子能力,而且协议所涉及的多数量子设备都比较昂贵。Boyer等开创性地提出了适用于量子方和经典方之间的半量子密钥分配协议。为了避免半量子密钥分配协议中攻击者Eve冒充合法参与者Alice或Bob,需要对通信参与者进行身份认证。基于Cluster态和类GHZ态等纠缠态,

学位

基于时域快速处理的SAR回波仿真算法研究

作为测试系统参数,验证成像算法性能和分析干扰噪声的重要手段,SAR的回波仿真对SAR技术的研究有着至关重要的作用。针对SAR回波模拟方法设计,本文首先对SAR成像方法展开了分析。SAR回波模拟方法主要分为时域方法和频域方法。频域算法基于快速傅里叶变换的逆向处理,能够通过较低的运算量获得良好的分辨率性能。然而,频域方法通常需要满足方位向不变假设,因此频域方法的应用将受到平台构型的限制,无法适用于任意

学位

基于深度学习的探地雷达杂波抑制与成像方法研究

探地雷达（Ground penetrating radar,GPR）是利用天线发射和接收高频电磁波来探测介质内部物质特性和分布规律的一种地球物理方法,在工程勘察领域的应用日益广泛。在探地雷达反演中,信号中的强杂波严重影响了反演过程中地底目标成像的精度,并且传统反演方法大多数采用非线性迭代优化算法求解,面临着求解时间久、计算复杂度高和参数设置冗杂等问题。本文将以低秩稀疏分解理论为基础的杂波抑制与成像

学位

结构光成像系统的非线性预矫正和标定方法研究

基于结构光条纹投影的成像系统因其无接触、高效率和高精度等优点,被广泛地运用于三维测量等计算成像领域。而结构光系统的非线性失真和光学畸变等因素降低了结构光三维测量的精度。本研究在结构光成像系统非线性模型的基础上,分析了各系统参数对展开相位估计精度的影响;提出了一种针对结构光三维测量系统空间几何畸变和光强非线性失真问题的预矫正方法;设计了一种实现结构光系统复合标定的快速方法。针对几何畸变和光强失真,建

学位

非线性滤波算法及其在组合导航中的应用研究

作为一门交叉学科,导航定位技术在地球科学、信息学科、智慧城市、物联网生活以及自动驾驶等方面发挥着越来越重要的作用。对于愈来愈复杂的现实场景以及定位需求,单一导航系统受自身的局限性影响,难以满足这些要求,组合导航随即成为导航定位研究的重点。组合导航将多种导航方法进行结合,通过组合手段抵消单一导航系统的不足,以此提高导航定位的精度以及性能。组合导航中的目标状态估计问题大多都是非线性滤波问题,常见的非线

学位

无线电地图辅助下基于深度强化学习的无人机路径规划

与本文相关的学术论文