基于深度强化学习的智能无人艇路径跟踪

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:yongjianok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪作为海洋的世纪,生态、经济、社会等多方面的发展都与海洋息息相关,对于海洋的开发与保护问题是一项长久的人类课题。其中,海洋自主航行器不仅可以大大提高人类对于海洋的探索效率,而且在开发利用海洋资源和保护海洋生态等方面也有重要的研究意义。无人艇作为一种海洋自主航行器,具有体积小、速度快、费用低和自主性强等特点,在恶劣环境中执行危险或枯燥的任务时具有独特优势。本文研究基于深度强化学习的智能无人艇路径跟踪的控制问题,主要的研究工作如下:第一,针对无人艇路径跟踪问题,本文提出了一种基于深度强化学习的全数据驱动的无人艇运动控制方法,克服了基于机理模型的运动控制方法的限制,建立了以数据驱动为核心的无人水面艇端到端自学习建模方法。基于神经网络预测模型,设计了能够实现无人艇路径跟踪控制目标的模型预测控制器。最后,对控制器进行了仿真验证。仿真结果表明,通过利用无人艇基于简单随机射击采样的输入输出数据对深度网络进行训练,提出的模型预测控制器能够使得无人艇准确地跟踪参数化路径。第二,针对无人艇路径跟踪问题,本文对无人艇路径跟踪控制方法进行了优化,采用一种更为灵活的模型预测控制方法即基于信息论为模型预测路径积分控制对无人艇路径跟踪问题进行研究。这种方法可以有效地解决有限范围非线性最优控制问题,不受状态成本函数限制。本文提出了一种基于深度强化学习和模型预测路径积分控制的无人艇路径跟踪控制方法。具体地说,利用深度强化学习方法训练神经网络来逼近无人艇的状态转换模型。然后,基于学习模型,使用模型预测路径积分控制器来获得最优动作。基于采样得到的控制动作,模型预测路径积分控制器通过计算得到最优的控制输入。最终,实现无人艇的路径跟踪任务。并针对直线、曲线等多种参数化路径跟踪问题进行了仿真验证。仿真结果表明,所提出的基于数据驱动的无人艇路径跟踪算法具有良好的性能。第三,针对无人艇避碰路径跟踪问题,设计了无人艇避碰惩罚函数,提出了集成避碰机制的模型预测-路径积分控制器。首先,利用随机输入输出数据对神经网络模型进行训练。其次,针对障碍物设计避碰惩罚函数,构建了集成避碰机制的模型预测-路径积分控制器。最后,对无人艇避碰路径跟踪问题进行了仿真验证。仿真结果证明了集成避碰机制的模型预测-路径积分控制方法的有效性。
其他文献
随着计算机视觉技术的发展,智能化教学成为了研究的热点。智能教学着重关注学生的情感变化以及学习状况。微表情作为一种无意识流露出的面部表情更能体现出学生的真实状态,其对智能化教学的普及有着重大的意义。但是,微表情持续时间短,强度弱,容易受到人脸、光照、噪声等因素的影响。因此,这对研究造成了一定的困难。针对教育场景中微表情检测与微表情识别存在的问题,本文主要研究内容如下:(1)针对教育场景中光照对图像预
学位
抓取机器人因其高效、灵活的特点而被广泛应用于物流分拣、工业制造等领域。目前,多数分拣应用场景都采用单臂机器人和传统视觉检测方式,其工作范围有限、负载能力不足、实时性弱、难以满足自适应分拣的需求。近年来,多机器人协作技术和深度学习的发展为解决上述问题提供了新的途径。本文设计了一个双臂协作分拣系统,利用机器视觉和深度学习技术对工件类别和位置进行检测,规划双臂完成大小工件的分拣任务,主要研究内容包括:双
学位
气动系统具有结构简单、能源清洁、安全可靠等优点,被广泛应用于发电、化工、汽车制造、微电子等工业自动化领域。然而,气动系统固有的强非线性、摩擦力等不利因素使得定位控制技术进展缓慢,而且目前工业领域应用的气动系统成本较高,网络化分布式控制能力较差。因此,为了提升气动系统的定位控制效能以及增强网络化分布式控制能力,本文将气动系统与CAN总线技术相结合,设计了一套控制功能分散、显示操作集中的基于CAN总线
学位
海洋具有丰富的生物资源和矿产资源,是各国开发研究的重点,是人类生存和可持续发展的战略空间和资源要地。伴随着新时期信息技术和智能控制理论的快速发展,世界各国开始推进无人航行器的研究,用于争夺海洋权益开发海洋资源。无人船是一种新型海洋探索工具,可以代替人力在恶劣的海洋环境下执行费力且危险的任务,在军事和民事领域有着广泛的应用前景。运动控制技术是衡量无人船智能化水平的重要标志。本文以欠驱动无人船为研究对
学位
船载风力发电系统因其可以改善船舶的能源供给结构,提高经济与环境效益,在船舶行业中具有广泛的应用前景。直驱式风力发电机的选用,减少了中间的能源转换环节,提高了装置的利用效率。本文面向船载风力发电系统的优化与控制展开研究,旨在提高风能利用系数上限值和改善最大功率点跟踪(Maximum Power Point Tracking,MPPT)控制效果。具体研究工作如下:首先,为提高船载风力发电系统的最大风能
学位
模块化多电平变流器(Modular Multilevel Converter,MMC)具有可扩展性好、电能质量高、故障穿越能力强、可实现能量双向流动的优点,近年来被广泛应用于高压直流输电、中压电机驱动和静止同步补偿器等领域。有源前端MMC作为连接交流电网和直流侧负载的接口,其控制性能的优劣直接影响电能变换的质量。因此,研究在交流电网出现单相电压跌落和电网电压含低次谐波等非理想工况下的有源前端MMC
学位
提高区域创新能力、完善区域创新体系是实施创新驱动发展战略的重要任务,地方政府官员作为经济政策的执行者和制度变迁的推动者,在其中扮演着重要的角色。为了研究官员变更引致的政策不稳定性对区域创新的影响,本文在理论分析的基础上,利用中国268个地级市的面板数据进行实证分析。研究发现:官员变更引致的政策不稳定性抑制了区域创新能力的提升,并且市长变更比市委书记变更的影响更大;如果市委书记由本地市长晋升或官员变
期刊
近年来,随着海洋资源日益被开发和利用,船舶运输越来越受到人们的重视。无人船因具有自动化程度高、小巧灵活、成本低等优点,在海洋作业中越来越受到研究人员的重视。无人船避障和协同一直是船舶远洋航行和海上作业必须考虑的问题,如何实时的避免无人船与周围静态和动态障碍物之间的碰撞,是编队控制中需要考虑的核心点之一。从保证无人船远洋航行安全和提高海上作业效率角度出发,本课题提出三种无人船防碰撞路径跟踪及协同控制
学位
因为输电网三相对称,所以能够使用单相模型,只需要计算单相潮流就能满足要求。而配电网中由于三相负荷和网络结构都不对称,必须进行三相潮流计算。由于不接地配网进行三相潮流计算时,需要考虑三相电流之和为0的约束条件。有文献采用电流注入型牛顿法处理此问题,增加了三相电流之和为0的约束条件,为了使约束方程的数量与状态变量的数量相等,需要将端点的三相功率作为待求状态变量。这一处理方法与配电负荷的功率给定值不相符
学位
近年来,在船舶电力推进领域出现了一种高度集成的电力推进装置—无轴轮缘推进器。与传统的柴油机推进、吊舱推进等方式比较,无轴轮缘推进器具有占用空间小、推进效率高等优点。永磁同步电机作为轮缘推进器的内置电机,其较多的槽数与极数会导致电机漏磁增加,转矩密度不高。此外,分布绕组的使用也导致轮缘推进器没有容错能力。基于磁场调制效应工作的永磁游标电机具有转矩密度高和结构简单的优势。为了提高轮缘推进器的转矩密度和
学位