基于深度强化学习的船舶自主避碰决策研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:jz1120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习具有结构简单、自适应性强的特点,已在自动驾驶、图像识别、金融贸易等领域广泛应用,利用强化学习技术解决船舶的自主避碰问题成为航海界专家和学者的研究热点。为解决多船会遇场景下的船舶避碰问题,提出了一种基于深度强化学习的船舶自主避碰决策模型。该模型主要包括航行场景划分层、风险评估层和决策规划层,场景划分层主要是通过参照规则中有关不同会遇局面构成条件以及船舶的避碰责任判定,在考虑船舶间避碰角色对称性的基础上,实现多船会遇场景下的航行态势划分及航路权的判断;风险评估层是从驾驶员注意力分配的角度,以构建粗粒度局部地图的形式编码船舶的航行状态信息,利用神经网络计算本船与目标船之间的碰撞风险;决策规划层是在态势划分和风险评估的基础上采用值函数逼近的方法,依据马尔可夫决策过程要素设计航行状态空间、动作空间、奖励函数以及动作选择策略和状态值函数以实现船舶智能避障与自主决策。最后,基于Open AI Gym平台设计了静态障碍物场景、典型两船会遇场景、多船会遇场景以及动态、静态障碍物并存场景,并分别从碰撞风险和最近避让距离的角度对避碰决策的合理性和有效性进行了分析。本文的主要创新性成果如下:(1)设计了一种基于相对航向的多船会遇场景划分方法。参照规则中两船会遇场景的划分方法,综合考虑船舶的相对方位、相对航向、避碰角色对称性的要素,将多船会遇场景量化为四个区域,并明确了各区域下本船的航路权及应采取避让行动。(2)提出了一种基于注意力机制船舶碰撞风险认知评估模型。通过构建局部地图,实现障碍物航行信息的动态编码,利用多层感知机技术将航行状态数据和地图张量转化为固定长度的向量作为模型的输入,使用归一化方法量化船舶的潜在碰撞风险。(3)构建了一种多船会遇场景下基于深度强化学习的船舶自主避碰决策模型。具体设计了船舶航行状态空间、离散化的避碰决策动作空间、融入避碰规则的奖励函数以及动作选择策略和状态值函数等要素,实现了复杂航行态势下船舶自主决策。
其他文献
实施城市更新行动是城市发展方式的重大转变。城市发展史上城市更新的主体在政府、土地权利人和市场主体之间有过演变,目前城市更新的部分地方法规除了强调政府主体和政府指定更新统筹主体外,更加尊重土地权利人的主体地位。国有企业的特征决定了其在城市更新中可以同时承担着“半政府”主体、产权人主体和市场主体的角色。从北京、上海、广州、深圳等地近几年的城市更新成果和项目来看,央企、国企参与旧城改造和城市更新的比例不
期刊
地方政府融资平台是城市建设发展的重要力量。在城市大规模建设阶段,地方政府融资平台在发挥积极作用的同时,也暴露出治理机制不健全等问题。在城市更新阶段,融资平台参与城市更新具有业务优势、平台优势和融资优势。从发达国家经验看,半公有化机构参与并有力推动城市更新进程。结合我国实际情况,认为参与城市更新是地方政府融资平台的重要机遇,提出以城市更新推动融资平台市场化转型发展、融资模式创新。
期刊
目前,我国城市发展已经从大规模增量建设转向存量提质更新改造阶段,城市更新行动已成为“十四五”规划中一项重要任务。我国文旅产业进入发展的新阶段,对文旅产品开发提质增效、文旅服务改善提升等方面提出了新要求。城市更新是文化旅游产业发展的新机遇,文旅产业赋能城市更新成为城市发展的新动能。文旅产业与城市更新双向赋能,既能提升城市更新能级和品位,也能促进城市文旅产业的发展质量。文旅产业发展和城市更新行动双向赋
期刊
山东昌乐蓝宝石属于玄武岩型成因,由于其原石颜色较深,大部分蓝宝石均需要热处理改色后再投入市场。本文以未处理的山东昌乐蓝宝石为研究对象,采用红外光谱、拉曼光谱、紫外可见吸收光谱、LA-ICP-MS等测试手段对其进行了宝石学特征、谱学特征、包裹体特征和化学元素等方面的分析,以此为基础系统地对山东昌乐蓝宝石进行不同温度的热处理,并分类总结该过程中的宝石学及谱学特征变化。主要研究结果如下:山东昌乐蓝宝石颜
学位
校本心理健康服务是美国青少年心理健康教育与服务的主要方式,在促进学生积极的心理健康和提高学业成绩方面发挥了重要作用。新冠疫情暴发之后,美国采取多种措施扩大校本心理健康服务供给:颁布法令,确保学生心理健康服务的优先地位;加大投入,为校本心理健康服务提供资金保障;拓展服务,增加学生获得心理健康服务的机会;重视研究,确保学生心理健康服务的成效等。美国校本心理健康服务为我国带来如下启示:应加强顶层设计,形
期刊
近年来,数字中国战略深入推进,各领域加快推动数字化、智能化建设,人脸识别等新技术应用需求呈爆发式增长。随着人工智能、大数据和云计算等新技术加速演进,人脸识别技术应用愈加成熟,已逐步在金融、交通、教育及安防等领域得到广泛的落地应用,为生产生活提供了便利、创造了效率与效益。与此同时,人脸识别技术在各领域应用过程中收集了大量的个人信息数据,导致安全风险激增,为个人信息安全乃至社会安全带来巨大风险隐患。因
期刊
针对如何为城市更新项目设计匹配合适的投融资模式这一难题,本文尝试从盈利能力为起点出发,按照“以收定支”的项目筛选原则统筹规划纯收益性项目和部分经营性、公益性项目,设计了“ABO+城市更新基金+社会投资人”模式。最终以C市城市更新综合建设项目为例,构建了城市更新项目投融资模式的设计思路。
期刊
大宗商品是重要的企业原材料,其价格波动直接影响到原材料的采购成本、企业的生产经营决策、社会的通货膨胀水平以及国民经济的健康发展(吴海民,2012;田利辉和谭德凯,2014)。大宗商品价格的剧烈波动会给企业带来巨大的风险,可能导致相关企业面临重大损失。我国政府高度重视套期保值在企业价格风险管理中的作用。例如,2021年,《国务院办公厅关于进一步加大对中小企业纾困帮扶力度的通知》指出,推动期货公司为中
学位
报纸
随着环境保护与经济发展不平衡程度的加剧,党的十八届五中全会提出“创新、协调、绿色、开放、共享”五大新发展理念,首次将绿色发展提升到国家发展战略层面;而后党的十九大又指出我国经济已由高速增长阶段转为高质量发展阶段,推动经济高质量发展成为我国当前阶段经济发展的重要课题。尤其是2020年中国在第75届联合国大会上提出了2030年碳达峰和2060年碳中和的“双碳”目标,实现经济的绿色发展变得日益迫切和重要
学位