融合规则和操纵性的并行强化学习的船舶避碰研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:fanjiao1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着航运业的快速发展,海上出现的船舶会越来越多,间接提升了海上事故发生率,因此船舶的航行安全受到更多的关注。当前一般智能算法(如遗传算法)应用于复杂环境中的动态避碰时表现不佳,如出现较多的转向次数或某些转角幅度较大,且较少同时考虑国际海上避碰规则和船舶操纵性的限制,使得规划的路径不满足实际航行轨迹的要求。本文以港口等交通繁忙水域的多船会遇场景为研究背景,选用在复杂环境中表现良好的强化学习算法,在算法中引入并行思想提高收敛性,且将国际海上避碰规则和船舶操纵性融入到强化学习算法中用于训练。该算法主要解决了复杂环境下动态避碰效果不佳,训练阶段算法收敛速度慢,规划路径与国际海上避碰规则和操纵性不符等问题。本文的主要研究内容如下:首先,对船舶避碰涉及到的基本理论知识进行了介绍。以船舶参考坐标系为基础,对船舶的相对运动参数进行求解、船舶领域知识和碰撞危险度进行了研究;对船舶常用的两种船舶数学模型进行了比较分析;对船舶会遇局面进行了详细的划分以及对避碰过程进行了解读;还对强化学习算法和遗传算法进行了对比,确定了强化学习算法为本文的研究方法。其次,为了证明选用的强化学习算法可以解决一般智能算法在复杂环境中进行多船避碰时表现不佳的问题,本文选用遗传算法作为比较对象,并用碰撞危险度和路径平滑度两个评价指标进行对比分析。既然本文选用的算法为强化学习,那么首先需要解决当应用强化学习解决全局路径规划时存在的算法收敛速度慢,转向角度大等问题,本文对传统强化学习算法进行了改进,引入了并行思想,通过改变算法结构,提出了一种多智能体并行Q学习算法,并在得到初始路径后对路径进行优化处理,使得规划路径满足船舶操纵性的要求;然后在动态避碰时,由于在复杂环境中Q表的维度限制问题,只用强化学习算法达不到要求,故在此结合了深度学习。但由于应用传统深度强化学习算法进行船舶动态避碰研究时会出现收敛速度慢的问题,故本文通过对两种架构不同的深度强化学习算法在倒立摆模型上的比较,选用具有并行架构的异步优势动作评价算法,并且为了使该算法规划的路径满足船舶航行轨迹的要求,在算法中加入了国际海上避碰规则和操纵性的限制。最后,在完成融入规则和操纵性限制的异步优势动作评价算法的船舶运动模型的训练后,对复杂水域下的三船会遇和四船会遇场景进行了仿真,证明利用该算法在复杂环境下规划的路径具有安全、转向幅度更小、规划得到的路径更符合船舶的实际航行轨迹等优点。且利用该模型在三种常见的会遇场景下进行了不同尺寸船舶的避碰仿真,证明本文模型的有效性。
其他文献
黄土丘陵区属于半干旱气候区,短缺的水资源是限制该区域农业发展的核心因素。多年来不合理的造林诱发了大面积的土壤干化,枣树具有极强的耐旱特性,是该区域退耕还林的主要经济树种,但枣地也出现了土壤干化现象。在土壤水分相对匮乏的干旱和半干旱区生态系统中,非降雨性水分(雾、露、水汽吸附(Water Vapor Adsorption)、土壤凝结水)是常见而显著的重要性水资源。黄土丘陵区陆面水分过程具有易变性,水
学位
<正> 答:热病昏迷,多系温病初起,邪侵卫气阶段,未能得到及时合理的治疗处理,抑或病者素体虚弱,正不胜邪,乃致病势逆变,热毒内攻,痰火上扰,湿热薰蒸,瘀热交阻等导致清窍闭塞,神失所守之常见
期刊
网络空间是现实社会公共生活的虚拟延伸,是维护社会公平正义和建构社会主义文明新形态的公共平台,更是亿万民众共同的文化领地和精神家园。网络快速普及发展给人类生产生活带来深刻变革,在丰富人民精神生活需要的同时,也带来了网络诈骗、网络暴力、网络谣言、网络色情泛滥等一系列网络公共秩序混乱新挑战。这些网络公共领域存在的种种失序乱象和问题,是与网络法治文化建设滞后分不开的。中国特色社会主义进入新时代,党的十九届
学位
期刊
目的 探讨母乳嗅觉刺激联合体位转换的干预方法对足月新生儿足跟采血的临床效果,为优化临床中足月新生儿足跟采血操作积累理论基础。方法 选取2021年3月—2022年3月宁波大学医学院附属医院收治的120例新生儿为研究对象,依照治疗方法的不同分为对照组与观察组两组,每组各60例。对照组采取常规足跟采血方法,观察组采取母乳嗅觉刺激联合体位转换干预下的采血方法。比较两组患儿的新生儿疼痛评分(NIPS)、采血
期刊
在全球气候变暖的背景下,干旱对我国的影响愈发严重。干旱问题复杂、干旱类型多样、不同干旱类型间的关联密切。了解不同类型干旱之间的传播过程,不仅可以加深对各类型干旱时空演变特征的认识,也可以进一步阐明干旱形成机制,对提高流域抗旱水平和抵御干旱风险的能力,具有重要的理论意义和应用价值。本文以中国九大流域为研究对象,基于地面观测资料、借助遥感、模型、同化、再分析和气候模式等多源数据集,探究了 1990-2
学位
碳源与碳汇的平衡发展是鹿邑县实现农业绿色、可持续发展目标的重要途径。由于农田生态系统受人为因素的影响比较大,又同时具有碳排放和碳吸收的双重属性,对整个碳循环系统具有显著性影响。因此,本文以河南省鹿邑县为研究区域、农田范畴内的净碳汇量为研究对象,在对国内外文献梳理的基础上,基于统计年鉴、农技站等相关的统计数据,分别对鹿邑县农田的碳排放、吸收进行了系统的分析。由此推算出净碳汇量的变化趋势、净碳汇的价值
学位
云南省是全球生物多样性资源,尤其是野生种质资源的热点地区,区域的生物多样性战略价值日渐凸显。COP15大会在云南昆明的顺利召开,使得“生物多样性”保护再次成为国际上的关注热点。本文通过收集相关资料,分析当前云南省生物多样性保护现状及面临的挑战;利用最小累积阻力模型MCR、重力模型、分区指数Did等方法,构建形成“三屏-两带-六廊”的云南省生态安全格局,并对云南省生物多样性生态修复区域进行判定与分区
期刊
土壤有机碳库动态变化及其驱动机制是目前陆地生态系统碳循环研究的重点和热点。黄土高原是全世界水土流失最严重的地区之一,为了控制黄土高原严重的水土流失,我国在沟道中大规模修建淤地坝,形成分布较为广泛的坝地。因此,深入探讨坝地形成过程中有机碳矿化的驱动机制就显得格外重要。本研究以黄土高原正沟小流域为研究对象,应用室内矿化培养试验、高通量测序、同位素示踪等技术,系统分析坝地形成过程中的有机碳矿化特征,对比
学位
黄河源区是黄河流域的主要水源地和产流域,对中下游地区的用水安全、粮食生产、工业发展和生态环境保护具有决定性意义。源区地理位置特殊,属气候变化敏感区,生态环境十分脆弱且极易受到破坏,干旱和洪水灾害事件频繁。随着全球气候变暖,水安全受到威胁,生态环境恶化,荒漠化加剧,陆地水储量下降,自我修复功能减退,黄河水资源短缺并伴随着生物种群数量下降和多样性丢失等现象。习近平总书记在黄河流域生态保护和高质量发展座
学位