基于航行规则的Q学习的船舶避碰研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户：wingerwesker

【摘要】

：

【作者】

：

王伊楠

【机构】

：

大连海事大学

【出处】

：

大连海事大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着世界经济总量的不断攀升,海上运输蓬勃发展,船舶数量也日益增多,随之船舶发生碰撞的可能性加大。因此,船舶避碰仍旧是船舶研究方向的热点问题之一。目前船舶避碰研究仍有许多问题还未解决,如《国际海上避碰规则》考虑不充分,未考虑船舶操纵性对避让效果的影响,避碰算法计算量较大无法实时给出避碰决策,算法的稳定性差以及多船避碰策略不合理等问题。本文针对已存在的问题,选择与模型无关且实时性良好的Q-Learning算法,并考虑船舶避碰问题自身的特点,从避碰规则、转向角度以及规划效率等方面优化船舶避碰路径,在不同会遇局面下进行两船和多船避碰仿真,规划出一条符合避碰规则且安全、经济的船舶避碰路线,主要的研究工作如下:（1）首先,分析国内外船舶避碰的研究现状,介绍了船舶避碰的基本理论,如船舶避碰的一般过程、船舶会遇态势、船舶领域、船舶运动参数和碰撞危险度。通过蚂蚁算法,粒子群算法和Q-Learning算法对比,因Q-Learning算法无需环境建模,并且算法具有计算简单,实时性良好等优点,本文最终选择Q-Learning算法作为主要研究方法。（2）其次,针对Q-Learning算法中探索-利用概率值固定的问题,选择模拟退火算法,将退火函数与Q值结合设定新的探索-利用概率值,使概率值在学习期间缓慢平稳的下降,从而解决探索与利用冲突的问题;为加快算法的收敛性,将启发函数与动作策略相结合,共同指导动作的选择;为保证较大环境规模下智能体实时提供避碰决策,将Q-Learning算法与Dyna框架结合,利用模拟样本数据更新值函数,加快学习速率,保证实时性;考虑船舶避碰问题自身的特点,将海上避碰规则进行量化,并在Q-Learning算法的回报函数中增加航行规则、转向幅度、安全性和经济性等函数,以满足避碰路径的要求。（3）通过PyCharm平台进行船舶避碰仿真。两船避碰仿真中,分别在对遇、追越和交叉相遇这三种会遇局面下验证设计方案的有效性,规划出一条符合避碰规则的安全经济的避碰路径。在多船避碰路径仿真中,以三船为例,在三种典型会遇局面下分别进行仿真,仿真结果验证了研究方法的可行性。

其他文献

开关磁阻电机无位置传感器位置检测策略研究

开关磁阻电机（Switched Reluctance Motor,SRM）具有节约稀土资源,容错能力强,调速范围广,生产成本低等特点。同时伴随着电力电子器件的更新与发展,开关磁阻电机组成的配套驱动设备被广泛应用于新能源混合动力、航空航天、油田煤田等领域。在众多应用领域中通常采用位置传感器采集的转子位置信息作为反馈信号,保证整个驱动系统的正常运转。但是位置传感器的使用也会存在诸多弊端,如在高温、高粉

学位

基于虚拟现实的AUV集群搜索仿真系统设计与实现

近年来,随着国家维护领海主权,建设海洋强国战略部署的实施,人们对海洋领域的探索、开发越来越深入。自主水下航行器（Autonomous Underwater Vehicles,AUVs）具有自主性高、探测范围大等特点,常常作为水下探索的重要工具。然而,AUV在实际的海上测试环节花费的经费高、周期长,对操作人员的风险也比较大,使用虚拟现实仿真技术来完成相关的测试工作可以有效的避免上述问题,虚拟现实仿真

学位

非结构化道路卡车经济性车速及队列控制研究

随着世界经济的快速发展,国内交通运输行业迎来高峰期,重型卡车在货物运输领域得到了广泛的应用,在给人们提供便利的同时也带来了环境污染、能源危机等一系列社会问题。卡车经济性驾驶和卡车队列行驶能够有效降低车辆的燃油消耗,为解决上述问题提供了重要手段,已成为目前车辆节能减排技术的研究重点。其中,卡车经济性车速优化与卡车队列控制作为车辆节能减排技术中的关键问题,对提升卡车队列系统的燃油经济性起着至关重要的作

学位

基于改进模块化神经网络的出水BOD预测研究

目前,我国水资源存在严重危机,能否对污水有效治理与人们生活息息相关。生化需氧量（Biochemical Oxygen Demand,BOD）是衡量水质污染程度的重要参数,对BOD的准确测量可以保证污水系统正常运行。传统测量方法时间久无法满足工程实时调控的需要,相比于传统测量方法,智能预测在水质参数检测方面实用性更强。但由于污水处理是复杂的生化过程,具有多参数、多流程、非线性等特点,单一神经网络往往

学位

多无人机的数据驱动编队控制方法研究

随着科学技术的日益发展,四旋翼无人机借助其悬停自由、起降便捷、飞行稳定和机动性高等独特优势,被广泛应用于军民等领域。近年来,工作环境和作业任务的日趋复杂对无人机的执行能力提出了更高的要求。与单架无人机相比,多无人机编队扩展了其作业能力,并具有更高的灵活性、容错性以及高效性。因此,研究多无人机的编队控制具有重要的理论意义和应用价值。四旋翼无人机具有欠驱动、强耦合、非线性以及难以建模等特性,并且扰动、

学位

基于无扰切换控制的失稳切换系统输出调节问题研究

为在不同工况下完成日益复杂的控制任务,现代工业控制系统呈现出多模态、多控制器的切换特性,切换系统因此受到广泛关注。切换系统在一些恶劣工况下会出现子系统和部分切换点不稳定的失稳动态,Lyapunov函数将在子系统激活区间和不稳定切换点处上升。同时,工程应用中为提高控制距离和降低成本,会在切换系统和控制器之间引入网络环境,这不可避免地带来了网络延时和网络攻击等问题,导致信息泄露和系统的不稳定。失稳动态

学位

三自由度并联船载稳定平台镇定控制研究

船舶受风、浪等海洋环境的影响会产生横荡、纵荡、升沉、横摇、纵摇和艏摇运动,不可避免地威胁到船用起重机等船载设备的运行安全,船舶动力定位系统可抑制船舶的横荡、纵荡和艏摇运动,并联船载稳定平台可隔离船舶的横摇、纵摇和升沉运动对船载设备的扰动,保证船载稳定平台上船载设备在惯性空间保持稳定,使其作业就像在陆地上一样,提高作业效率并增加可工作时间窗。然而,并联船载稳定平台是一个具有高度非线性、强耦合、变负载

学位

基于PLUS模型多情景分析的土地利用变化及生态系统服务价值评估——以福州市为例

【目的】开展不同发展情景下土地利用变化的模拟及其引起的生态价值变化研究，对促进土地科学开发利用、构建生态系统安全具有重要意义。【方法】本研究以福州市为例，基于2000～2030年土地利用数据，运用PLUS模型进行自然发展、耕地保护和生态优先3种情景下的土地利用模拟，再采用价值当量因子法分析不同情景下的生态系统服务价值（ecosystem services values,ESV）变化。【结果】运用斑

期刊

基于改进深度Q网络的移动机器人避障路径规划

移动机器人避障路径规划是移动机器人领域研究的重点,移动机器人在室内复杂环境进行作业时,环境的复杂性与易变性给移动机器人带来了更多挑战。而深度强化学习作为一种不断试错的机器学习算法,目前广泛应用于移动机器人避障路径规划领域,在静态障碍与动态障碍同时存在的复杂环境中,使移动机器人具备灵活决策的能力,提高移动机器人的自主性与鲁棒性。因此本文以深度强化学习为基础,使移动机器人与周围环境不断交互,完成避障路

学位

面向海上溢油的双光图像分频特征融合研究

近年来,随着能源需求量的增长,海洋石油开采与运输活动日益频繁,由此也造成了诸多海上原油泄漏与环境污染问题。因此,海上溢油监测系统的建立与优化问题研究迫在眉睫。现有溢油监测系统主要使用单一的某类传感器作为数据获取手段,其数据利用率和准确性受环境干扰影响较大。为提高系统监测性能,本文采用了红外和可见光两种传感器进行海面溢油数据获取,并研究了基于深度学习的红外和可见光图像融合机制,从而使得可见光图像中丰

学位

基于航行规则的Q学习的船舶避碰研究

与本文相关的学术论文