基于强化学习的四旋翼自主导航方法研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:jxj860205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着四旋翼无人机(简称四旋翼)在航拍、资源勘探、农作物保护等领域的广泛应用,业界对其控制性能和智能化程度的要求也越来越高。与此同时,机器学习(如神经网络和强化学习)在机器人的控制和导航方面也渐渐发挥出优势。本文通过神经网络和强化学习的方法来提高四旋翼的控制性能和智能化程度,主要研究四旋翼建模、控制与自主导航等问题。首先,针对四旋翼非线性强、易受干扰及建模不准确的问题,本文提出了一种基于BP神经网络的建模方法和控制器设计方法。根据四旋翼的运动学机理建立了主成分模型,利用BP神经网络辨识出了补偿模型;在完整模型(包含主成分模型和补偿模型)的基础上,利用Backstepping方法分别设计了关于位置、高度、航向、姿态的非线性子控制器。本文的方法使得四旋翼的控制更加精确,并通过Unreal Engine 4的迷宫场景验证了航点跟踪性能。然后,本文考虑了空地协同迷宫导航问题。使用四旋翼的高空三维视角来获取环境信息,并利用图像处理的方法重构迷宫;随后在重构的迷宫中,利用Q-Learning强化学习方法去搜索从给定起点到终点的最优路径;最后将此最优路径发送给无人车,使其完成迷宫路径跟踪。在搜索最优路径时,本文提出了一种新的搜索策略(改进的?-贪心策略),这种策略可以显著减少最优路径的搜索时间。本文从动态规划的角度分析了该方法的收敛性,也通过各类迷宫场景展示了该方法的有效性。最后,本文考虑了四旋翼在复杂环境中的自主导航问题。传统的导航方法一般先将环境空间离散化为栅格空间,然后进行路径规划。但不同的离散化方式会导致不同的规划结果。本文提出了一种基于策略梯度强化学习的自主导航方法,其不需要离散化空间,而直接在连续空间中完成交互。在四旋翼飞行过程中,通过一套神经网络去自主记录和在线学习出最优路径,这使得四旋翼可以完成端到端的无碰撞自主导航。本文通过理论推导给出了策略梯度方法的原理及改进分析,并在由Unreal Engine 4构建的复杂环境中验证了自主导航的有效性。
其他文献
在内弹道的各项参数中,速度和加速度是非常重要的参数,它反映了目标物体的力学特性和弹药特性,因此运动速度的测试对于武器系统的研究具有重要意义。在利用毫米波多普勒雷达对小口径管内运动物体的速度进行测量时,例如对枪管内弹丸运动速度进行测量,发现枪膛内获得的回波信号经过处理后得到了两条速度曲线,分析原因是出现了多普勒频率模糊的问题。针对这一问题,本文提出了多普勒频率模糊是由于波导内存在多种模式的猜想,通过
新型工业过程(New Industrial Process,NIP)包括石油化工、食品制药、冶金建筑等关系民生发展的众多方面。随着社会科学的发展,NIP呈现出了综合性强、分工复杂等特点,工业方面的产能需求和经济效益,促使着NIP不断向分布式控制管理方面发展。分布式控制是节能、降耗、减排的有效途径。传统的控制策略无法应对新型工业过程NIP高维度和多变量耦合的过程,所以对NIP实现全流程优化的关键问题
特征技术是CAD/CAPP/CAM集成的核心技术,通过将各个模块需要的参数信息封装到特征上,能够实现三者的最终集成。将特征技术应用到木工数控加工中,能够快速的实现木工数控编程,
苯并异噁唑衍生物是一类含有苯环并氮氧五元杂环结构的化合物,该化合物可作为关键的合成子参与多种不同类型的反应,包括多组分反应、亲核反应、亲电反应、自由基反应等,生成各类含氮或含氧的有机化合物。基于苯并异噁唑衍生物丰富的环异构化反应活性,本论文研究了该类物质在过渡金属催化的条件下的开环与重排反应,高效率高选择性的用于构建各类含氮和含氧的有机小分子化合物。本文一共分为三个部分:第一部分:总结了近些年以重
壶瓶碎米荠(Cardamine hupingshanensis)是十字花科碎米荠属多年生草本植物,属于超聚硒植物。硒是人和动物的必需微量元素,因此可以通过从高聚硒植物中获取对人类有益的有机硒来补硒,而探索壶瓶碎米荠体内的硒代谢机制成为当前研究的热点。研究发现80mg·mL-1的硒处理壶瓶碎米荠,其叶内GST-u4基因表达量显著增加,推测GST-u4基因与硒螯合作用及液泡贮存有关。本文采用RT-PC
纯电动汽车技术是当前汽车技术发展的热点方向,动力总成作为纯电动汽车的核心部件,其结构形式及性能优劣直接影响整车布置形式以及动力性与经济性。全电集成动力系统将永磁同
氯化石蜡(chlorinated paraffins,CPs)作为斯德哥尔摩公约新增列的一类新型持久性有机污染物(POPs)受到国际社会的广泛关注。我国是CPs最大的生产、使用和出口国。与其它POPs类似
蜂窝结构具有耐冲击性好、材质轻、耐高温、耐腐蚀等性能,被广泛应用于航空航天、超音速飞行器、船舶工业等领域。在蜂窝结构服役过程中,蜂窝芯与蒙皮之间的结合部位易发生固化,从而产生脱粘现象。所以,开展蜂窝结构的脱粘缺陷检测是必要的。红外热波无损检测技术具有检测速度快、检测精度高、检测面积大等优点,为蜂窝结构的缺陷检测提供了一种新方法。基于红外热波检测基础理论,完成了脉冲激励下蜂窝板结构瞬态热传导分析;在
图熵是图论与信息论结合的产物,也是图论中一个重要的研究方向。而其中对于图熵极值的研究是近年来研究的热点。由于图的不变量与图熵之间具有密切的关系,因此图熵能够准确反映出基于该不变量的图结构信息。通过局部、全局不同不变量构造的图熵,可以反映出图的局部、全局不同不变量的结构信息之间的关系。而当图熵应用在复杂网络中作为网络中心性的判别策略时,其反映的结构信息又可以看作是网络复杂度。因此,图熵不仅是图论理论
传统的联络通道跨度一般较短,普遍采用单侧冻结模式加固地层,然而伴随地铁建设的高速发展,涌现出一批采用双侧冻结模式的长联络通道,现有的研究成果难以充分地描述其温度场、