基于深度强化学习的水面无人艇路径跟踪和避障研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kkkwwwbushiwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水面无人艇作为无人系统的重要组成部分之一,在科研、民用和军事等多个领域有着广泛的应用。对于无人艇来说,保证其沿着规划路径进行航行并避开障碍物是无人艇执行各项任务的前提条件。因此,关于无人艇的路径跟踪和避障控制算法的研究是十分重要的。由于环境干扰复杂性和无人艇自身欠驱动特性,现有的控制算法在进行路径跟踪和自主避障控制时,常存在参数整定复杂、准确建模困难、复杂计算较多等问题。因此,本文尝试引入深度强化学习算法来解决无人艇路径跟踪和自主避障问题,首先设计了一个适合无人艇运动控制强化学习算法训练的仿真环境,并在该仿真环境的基础上,研究基于深度强化学习的无人艇路径跟踪算法和自主避障算法。具体而言,本文的研究内容如下:①本文构建了一个面向无人艇运动控制的强化学习仿真环境。为了解决无人艇运动控制训练环境缺失问题,本文首先通过对比分析选择合适的水上仿真环境作为基础进行开发,对实验使用的无人艇进行了仿真建模。随后,本文开发了一个ROS软件包对仿真环境和无人艇仿真模型进行封装,并设计了路径跟踪和自主避障场景的生成方法,为后续基于深度强化学习的路径跟踪和避障算法研究提供了基础。②本文提出了一个基于柔性演员评论家的无人艇路径跟踪算法。针对无人艇的路径跟踪问题,本文结合矢量场算法制导,以无人艇的操纵和控制要求为基础,将其转化为马尔可夫决策过程,合理设计其状态空间、动作空间和奖励函数;然后使用柔性演员评论家输出舵角指令,进而实现无人艇的路径跟踪控制。本文在仿真环境中对算法进行了训练和测试,仿真实验结果表明该算法相比于其他对比算法,具有跟踪误差小、航向控制稳定、调节速度快、抗干扰能力较强等优点。③在无人艇路径跟踪算法的基础上,本文进一步提出了一个结合表示学习和柔性演员评论家的端到端无人艇自主避障算法。针对无人艇航行过程中的避障问题,该算法使用激光雷达传感器的点云数据来实时获取周边障碍物的信息,并通过引入表示学习对点云数据提取隐层特征,缓解了深度强化学习算法训练初期学习效率较低问题。仿真环境中的实验结果证明了该算法相比于对比算法在训练过程中可以更快的达到收敛,并且在无人艇路径跟踪和趋向于目标点场景都取得了较高的避障成功率。
其他文献
在旅游业高速发展和旅游行为日常化大众化的背景下,旅游景区的游客拥挤现象已经成为城市管理中不可忽视的问题之一。从城市尺度来看,这种拥挤是由游客的不均衡分布造成的,大量游客在少数景区聚集,导致热门景区人满为患,其他景区却无人问津,既影响了游客体验,也不利于旅游资源的有效利用,亟需对游客进行分流。但现有游客分流研究或过于宏观缺少验证,或聚焦于优化分流算法忽视游客目的地选择的内在逻辑。随着学术领域对旅游者
学位
为推动发展云边协同制造和柔性制造,探索制造资源相关的动静态数据组织、集成和共享方法,本文以单个柔性生产制造系统为例,以制造装备资源的建模和描述作为切入点,通过对其生产制造装备资源及其应用情况分析,构建较通用的制造装备资源描述模型,为实现数据信息云边协同共享和装备资源的柔性重组、协调控制提供基础方法。根据多品种、小批量生产的柔性生产系统的特征,面对海量多源的资源属性信息数据,为有效地表达、组织和利用
学位
报纸
揭阳国家级非遗灯杆彩凤习俗,寄托了千百年来江氏族人慎终追远的情思,寄予了人们对美好生活的向往。当前,灯杆彩凤这项民俗文化在传承中面临着活动间隔时间长、习俗意义被淡化,组织者老龄化、传承后继乏人等困境。为突破困境,揭阳当地民俗文化保护者应加强常态化宣传与保护工作、重视对民俗文化传承人的保护与培养、多举措拓展民俗文化生存空间,进而促进民俗文化的保护和传承工作,让民俗文化所承载的中华优秀传统文化精神被发
期刊
随着通信技术的发展,在提高频谱利用率方面主要通过使用高阶调制信号来达到,但高阶调制信号具有较高的峰值平均功率比,进而导致其通过射频功率放大器(Power Amplifier,PA)时会发生严重的非线性失真,通过对信号进行线性化处理可以降低失真并提高功率放大器的效率,由此线性化是必要的,而由于数字预失真技术(Digital Predistortion,DPD)具有软件可配置等优点,成为了信号线性化的
学位
<正>2022年6月,中共中央办公厅发布的《纪检监察机关派驻机构工作规则》(以下简称《规则》)正式施行。《规则》作为加强和规范纪检监察机关派驻机构工作的基本遵循,共7章56条,对各级纪检监察机关派驻机构的指导思想、职能定位、工作原则、组织设置、领导体制、工作职责、履职程序、管理监督等方面作出了全面系统的规定,具有很强的政治性、基础性和规范性,是新时代纪检监察机关派驻监督工作制度建设的标志性成果。
期刊
高性能气体传感技术研究一直是电力变压器油中气体在线分析领域的重要研究方向。论文研究不同晶粒尺寸二氧化锡气体传感器对H2和C2H2两种故障特征气体的检测特性:以第一性原理为理论依据,建立Sn O2单胞晶体模型,在此基础上构建H2和C2H2气体的吸附模型进行气敏机理分析。通过水热法合成不同晶粒尺寸Sn O2,由各表征手段证明为所需材料后制备旁热式气体传感器。对其温度特性、浓度特性和动态响应-恢复特性等
学位
在现代社会,人们通过阅读各种推送文章来获取信息的方式越来越流行,因此长文本智能生成准确摘要的任务成为了研究热点。文本摘要技术可以提高用户获取重要信息的效率,并且可以降低人工编辑的成本。目前中文文本摘要任务的研究多集中在短文本领域,中文长文本摘要任务存在很大的挑战:缺少对应的中文长文本摘要数据集。同时,对长文本输入普遍的解决方法是先将文章拆分成几个部分,单独进行抽取后再合成最终摘要。但其对章节特征的
学位
当前,我国在航空航天、武器装备、工业机器人等战略新兴产业对高端精密减速器的需求大大增加,而传统减速器的性能已经远远不能满足要求,在大部分具有精密高端要求的装备上使用的减速器仍然需要从国外进口。精密减速器的设计目标是实现高精度、小体积、大速比、高刚度、高承载和高可靠性等,其中高精度与高可靠性、高刚度与高精度、小体积与大速比之间的矛盾是影响减速器性能的重要因素。因此,为了解决精密减速器高精度与高可靠性
学位
涡轮叶片作为航空发动机关键零部件多服役于高温高压、高速动载等复杂恶劣环境,其加工精度直接影响航空发动机服役性能。通常,涡轮叶片精密铸造成形后,原则上型面是不再进行精密加工;但受制于成形工艺与材料,易出现型面局部超差、余量不均等问题,仍需采用精密磨抛加工工艺保证叶片廓形精度与表面质量要求。数控砂带磨削技术已逐渐应用于航空发动机风扇、压气机叶片型面的精密加工,而近年来机器人磨抛技术因其高集成性和高灵活
学位