基于深度强化学习的无人艇避碰算法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:swangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人水面艇(Unmanned Surface Vehicle,USV)已经在军事、科考等众多领域得到了广泛的关注。因其具有灵活、快速的特点已经在非常多的研究中扮演起重要的角色。一套可靠的自主避碰系统无疑是无人水面艇安全航行的必要保障,在面对碰撞危险时及时、合理的避让动作很好地保障了人类的生命财产安全。无人艇自主避碰系统的运行需要稳定和可靠;规划出的轨迹需要平滑且安全;避让行为需要符合规则与操纵性,这样的自主避碰系统才会具有更广阔的工程应用前景,具有更高的实用价值。深度强化学习算法作为人工智能领域的一颗耀眼的明珠,受到了广泛而密切的关注。它结合了强化学习方法和深度学习方法而具有非常优秀的感知和决策能力,可以说是船舶避碰领域非常具有研究价值与前景的研究方向。本文结合人工智能深度强化学习方法,考虑了国际海上避碰规则与操纵性,在全局静态路径规划和局部动态避碰决策两个主要方面进行了无人艇自主避碰算法详细的研究、设计与验证。本文的研究主要是针对以下几个方面进行的:第一部分是静态栅格环境下的全局路径规划算法的设计。针对大范围海域下状态空间庞大导致训练非常困难的问题,采用分层的思想,将环境分割为不同精度的栅格化仿真环境,在更高层容易训练的环境中得到高奖励路径并用于指导低层复杂环境的训练。最后在大范围的栅格海域环境下进行了全局静态路径规划算法有效性的验证。第二部分是局部动态环境下避碰算法的设计。针对海上局部动态实时避碰问题,在算法上,结合深度强化学习D3QN算法,通过双学习方法减小过估计的发生,采用决斗网络结构提升训练效率。针对传统的基于计数好奇心的强化学习优化探索方法在状态庞大的环境下难以使用的问题,结合无人艇避碰特点,提出基于类计数好奇心的优化探索方法,与改进前的算法进行对比验证了改进的有效性。在训练环境上,算法考虑了无人艇的操纵特性和国际海上避碰规则,具有一定的实际意义。第三部分在更为复杂的环境中进行了避碰算法的设计。本章加入了噪声网络来驱动智能体探索,引入了优先经验回放机制优化了采样模式,同时采用了状态剪裁等众多优化手段有效地提升了训练效果。在模型上额外考虑了舵机特性对无人艇运动的影响,在具有一定的随机性的环境和具有一定的复杂度的两种环境下分别进行了避碰算法的测试与对比,证明了改进的算法具有更加显著的避碰效果。最后基于本文的层层递进式的研究框架,描绘了无人艇自主避碰算法的总框架,并探讨了工程化的结构与可能性。
其他文献
随着智能交通系统(Intelligent Transportation System,ITS)的发展,汽车行业也迎来了一次科技革命,逐渐向智能化、网联化方向发展,车联网(Internet of Connected Vehicle,IOCV)应运而生。作为ITS的重要组成部分,IOCV不仅提升了驾驶人员的驾驶体验,也为层出不穷的交通问题提供了新的解决思路,有效缓解了交通拥堵、交通事故、尾气排放、能源
学位
根据对交通部《海上交通事故报告》的分析,碰撞性事故数量占海上交通事故总数一半以上,船舶碰撞危险度的值是判断船舶下一步是否采取避让行动的条件之一。此外,船舶碰撞危险度可以为船舶避让时机的选择提供参考。所以,船舶碰撞危险度是海上交通领域研究的重点之一。传统碰撞危险度数学模型仅仅利用船舶间的距离、速度等因素计算船舶碰撞危险度,不能完全反映航行水域环境等其他因素对船舶碰撞危险度的影响。特别是船舶在港口、狭
学位
近年来,无人机技术得到了迅速的发展,在民用、商业和军事领域发挥着越来越重要的作用,尤其是在搜索、救援和监测海洋环境中的目标。在复杂未知的海域中如何实现多无人机协同搜索多目标的任务,已成为无人机应用领域一个重要的问题。本文以无人机为海域搜索的基本单元,对多无人机协同搜索技术中的通信拓扑优化、未知环境中的动态目标搜索以及实时航迹规划等几个关键问题进行研究,主要工作内容如下:(1)针对多无人机间的通信拓
学位
随着国家层面对海洋资源的重视程度不断加深,相关行业在智能无人艇控制发展上也有了更高的要求。无人艇有着体积小、响应速度快、经济高效等优点。作为无人艇运动控制的重要一环,路径跟踪控制在水文监测、反潜猎雷、异构编队和水面搜救等方面都有着重要意义。但同时,由于无人艇存在诸如模型参数的不确定性、执行机构易推力受限等不可避免的问题,这给无人艇在复杂海洋扰动下的路径跟踪控制提出了更艰巨的挑战。本文结合上述情况进
学位
室内定位技术的发展对机器人导航、工业测量、生物医疗等技术的发展有着重要的推动作用。在红外定位、激光定位、视觉定位和超声定位等重要室内定位中,超声定位以其轻量级、成本低、功耗小的特点被广泛应用。超声波传感器的测量精度是影响其定位精度的重要因素,然而,现有超声传感器的测量精度有限,实现基于超声传感器的高精度测量一直是室内定位技术的研究热点。为此,本文提出了一种融合超声波接收信号强度测量算法(Recei
学位
近些年来,船舶在海上救援、海洋勘探和资源开发等各种海洋工程起到了关键的作用,使得船舶运动控制受到了广泛的关注。船舶在执行路径跟踪任务时不受时间要求,只需对目标路径的几何位置进行跟踪。本文充分考虑了船舶在实际航行中的各种问题:过大的信号会使得船舶执行器造成物理损坏;在狭小水域,船舶的误差不能过大,否则会引起碰撞危险;时刻产生的制导信号会使得船舶控制器计算压力过大;时刻产生的控制器信号会加大执行器的物
学位
近年来,随着智能化技术的不断发展,无人水面艇的研究受到了越来越多学者的关注。无人艇自主航行技术是无人艇技术的研究焦点,是保障无人艇安全、高效航行的关键技术,必须进行大量的测试和评价后才能投入实际应用。我国无人艇自主航行能力的测试与评价技术仍处于起步阶段,具有较大研究空间。针对这一现状,本文对自主航行算法测试与评价技术展开了研究。主要研究内容如下:首先,对无人艇的自主航行能力进行了分析,提出了自主航
学位
对现实生活中真实且复杂问题进行探究的过程就是项目化学习,这种新型的学习方式是提升学生核心素养、落实立德树人根本任务的有效途径。以项目式学习为实施方式,结合学校的本土资源,探索新型的生态课程。从“四步流程”式的学习范式入手,进行“四维框架”式的体系建构,探索“四线联动”式的实施策略,对项目式生态课程进行校本化重塑,突破学科育人模式,实现全面育人。
期刊
随着科技的发展,无人水面艇作为一种具有自主航行和决策能力的新型智能平台得到越来越多的重视,并且在资源探索、经济航运、国防安全等问题方面都具有无可比拟的优势,为此,世界各国均在不遗余力的发展其核心控制技术。目前而言,其航行控制主要可以分为航向控制、路径跟踪控制和轨迹跟踪控制。面对复杂的海况条件,如何保持无人水面艇的控制精度是一项严峻的挑战。本文以“蓝信”号无人水面艇为研究对象,针对航向控制、路径跟踪
学位
水下无人航行器(Underwater Unmanned Vehicle,UUV)凭借良好的灵活性和安全性,能够实现对未知海域的环境勘探以及紧急救援。从实际勘探角度分析,欠驱动UUV在未知海域内执行巡岸任务时,通过利用所携带的声纳设备获取水下环境信息,从而实现对该海域内目标轮廓的构建。同时,根据构建的地图轮廓对该片海域进行巡视,及时掌握水下环境信息。本文对欠驱动UUV巡岸地图构建并跟踪的研究工作安排
学位