基于强化学习的固定翼无人机控制与路径规划

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hnkfxndz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来无人机的自主性和灵活性得到了很大程度的提高,无人机已经是一种重要的飞行设备并被广泛的研究和应用。然而由于无人机执行飞行任务时输入的地图不够精确所带来的环境不确定性,以及外界环境的干扰或是自身模型的不确定性带来的控制扰动,使得对无人机自主飞行能力提出了更高的要求。强化学习作为当今热门的一种机器学习的研究领域,为无人机的在具有环境不确定性和干扰的情况下进行路径规划和控制提供了新的解决方案。本文结合固定翼无人机并围绕上述几个方面展开以下的研究:针对传统单一的PID控制器对固定翼无人机姿态控制鲁棒性差并且无法解决外部环境与内部模型参数具有不确定性的问题,设计了一种基于近端策略优化与传统PID的串级控制器,将无人机当前状态作为强化学习控制器的输入,输出作为PID控制器的输入。经过训练后的强化学习控制器,可以根据固定翼无人机的状态的输入以及模型参数,对固定翼无人机进行精准控制,从而克服了控制中响应慢、外界和模型不确定性的扰动等问题,提高了控制的鲁棒性。防止因为在恶劣环境下使用单一控制器导致控制策略固定且单一使得无人机坠毁从而造成损失。针对固定翼无人机在输入地图不够精确所带来的环境不确定的情况下对固定翼无人机进行路径规划,设计了一种基于球型膨胀和双深度Q网络(SE-DDQN)的两层结构的路径规划算法,实现对不确定环境的适应性同时使得规划路径能够满足固定翼无人机的动力学约束。在第一层中,利用球型膨胀的算法不考虑环境不确定性以及固定翼无人机的动力学约束的情况下快速的生成一条初始路径,并从初始路径中选取合适的子目标点作为第二层优化器的输入。在第二层中,使用强化学习中的深度Q学习算法在样本环境中训练出的局部路径优化器,生成第一层选取的相邻子目标点之间子路径,这些子路径均是考虑了环境不确定性和固定翼无人机的动力学约束。最后将所有优化而成的子路径依次连接便得到了最终的飞行路径。最后,为了验证提出方法的可行性和有效性,在Matlab环境下对局部路径优化器和控制器进行了训练,搭建了飞行环境对上述方法进行了实验验证,并与其他一些同领域的算法进行了对比,实验结果表明所提出的方法在固定翼无人机路径规划和控制方面具有很好的性能。
其他文献
森林资源是地球上重要的资源之一,它不仅能够为生产和生活提供原材料,还能够调节气候、保持水土,减轻旱涝、风沙等自然灾害。频发的森林火灾严重威胁着人类的生命财产安全。因此,对森林火灾进行实时有效的检测是近年来的一个热点问题。近年来,基于深度学习的目标检测算法快速发展,具有检测精度高、速度快的优势,被越来越多地应用于森林火灾检测领域。在深度学习模型中,残差神经网络是非常经典和常用的一种。由于在输入和输出
学位
同时定位与地图构建(Simultaneous Localization And Mapping,SLAM)作为移动机器人和自动驾驶系统中的一项关键技术而得到了广泛的关注。随着各类应用场景需求的不断升级,对SLAM算法的精度、鲁棒性以及计算效率等方面的要求也不断提高,需要其拥有良好的环境适应能力。由于三维激光雷达具有较高的测量精度和稳定性而备受青睐,基于激光雷达的定位与建图算法在室外等复杂应用场景中
学位
人脸识别技术的发展从20世纪70年代开始兴起,是计算机视觉领域迄今为止最热门的研究课题之一。随着互联网技术的发展和大数据的积累,基于人的脸部特征信息的身份识别、表情识别在金融、安防、智能控制等领域有着十分广泛的应用。众所周知,大脑视觉皮层具有最强的视觉模式识别功能,其网络模型与目前主流的人工神经网络在神经元模型、网络结构、学习方法等方面有巨大差异。针对基于深度学习的卷积神经网络依赖大数据样本且功耗
学位
涡扇发动机是影响航空运输安全的关键因素,所以对其剩余使用寿命的准确估计便显得尤为重要。涡扇发动机中气路系统的故障概率最高,其失效过程十分复杂,一方面变化点对退化阶段的影响较大,且变化点的发生时间和数量难以预测;另一方面涡扇发动机气路系统的退化过程受多种内外因素影响,不可避免的呈现多种退化模式。如果不能准确的识别出该发动机对应的退化模式,则那些有差异的退化数据会不可避免的影响模型的训练和参数的估计,
学位
四旋翼无人机因具有高机动性、结构轻便、低成本等优点,吸引了大批学者、科技公司、政府的关注,在许多研究人员、学者前赴后继的共同努力下,四旋翼无人机已经广泛的应用于电力巡检、农业植保、灾后救援、物流运输、娱乐航拍、军事侦察等领域。无人机的自主飞行能力是其能否进一步扩展应用领域的关键,而性能卓越的路径规划方案和精准的轨迹跟踪能力又是其核心所在。因此,针对这两个问题,本文主要开展以下研究:首先,构建了无人
学位
隧道入口区域车车协同问题突出,同时一致性程度是刻画隧道入口区域车车协同机理的重要方式。然而现有针对隧道入口区域车车协同的研究较少,对行驶一致性的描述方法尚不成熟,在该区域以车车协同行驶一致性为切入点的研究面临挑战。因此,研究隧道入口区域车车协同模型,建立对应的一致性描述和控制方法,以提升该区域车车协同性能,对缓解该区域突出的交通问题具有重要的理论意义。为此,论文以车车协同行驶一致性为牵引,建立针对
学位
近年来,随着私家车保有量的飞速提升和城市道路网建设的不断扩张,交通拥堵、碰撞事故和尾气污染等问题日益突出。数据显示在密集的交通流中,道路事故多源于驾驶员主观操作不当,因此对驾驶员的主观驾驶行为特征进行建模与分析成为研究交通问题成因的重要切入点。同时,特殊的道路管理条例和智能车辆等新技术成为了优化道路交通状况的重要议题。随着车联网、人工智能等技术的发展,智能车辆与普通车辆共同行驶在城市道路上的状况将
学位
大量的理论分析、试验和几十年工程经验表明,大多数实际物理系统具有不确定性、受扰性、机理模型复杂、子系统交错等动态特性,保证这类复杂系统的控制性能对控制器设计和稳定性分析带来了极大挑战。本文以提升系统控制精度和稳定速度为目标,重点围绕受扰复杂系统渐近跟踪及预设有限时间控制两个方面展开研究,主要完成的创新性工作如下:(1)研究了一类状态受限情况下带有非消失扰动严格反馈系统(Strict-feedbac
学位
随着社交媒体平台的不断繁荣,社交网络已成为公众生成及传播信息的重要渠道,相关研究受到国内外学者广泛关注。其中,热度预测是社交网络信息传播的热点话题,在舆情跟踪、虚假新闻检测等方面具有重要应用价值。近年来,基于深度学习的端到端信息传播热度预测方法,因其强大的特征提取能力,越来越受到关注。目前大多数方法都显式或隐含地将观察期内的传播规模作为一个关键特征,然而,当观察期较短时,热门和非热门消息的早期传播
学位
如今,互联网模因(Internet Memes)在Twitter和Facebook等社交媒体平台上广泛传播。互联网模因通过图像结合文本的形式呈现,给人们交流和分享提供了新的方式。互联网模因分类旨在识别一个模因表达的情绪和意图。通过对互联网模因挖掘分析,可以进行情绪分析和舆情挖掘,并且可以在一定程度上避免网络暴力行为的发生,有助于营造和谐、稳定的网络环境。互联网模因具备多模态特点,现有互联网模因分类
学位