基于深度学习的水下单目深度估计方法研究

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:lyqhaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景的深度估计是计算机视觉领域中的一个经典问题,也是三维重建、图像合成等应用中的一个重要组成部分。深度估计问题根据描述场景的视图数量,可以分为单目视图与多目视图。与基于多目视图的深度估计方法相比,基于单目视图的深度估计方法在设备和环境的要求上更为简单,具有更为广泛的应用价值。但由于缺少诸如运动、立体视觉等可靠的深度线索,以及理论上单目视图中任意像素点的深度值均可以有无数个解,因此单目深度估计任务非常具有挑战性。传统的单目深度估计方法在处理该问题时主要依赖于阴影、纹理等图像本身的特征来构建数学模型,以实现像素值与深度值之间的映射。虽然这类方法的实现更为简单,但是都需要对深度估计问题附加额外假设,难以广泛地在各应用中进行推广。而基于深度学习的单目深度估计方法可借助卷积神经网络的强大性能,直接建立彩色像素与深度值之间的关系映射,这不仅获得了比传统方法更为优秀的估计结果,而且具有更好的泛化性能。但是目前基于深度学习的单目深度估计研究主要是在空气环境中进行的,水下环境的研究仍然以传统的视觉方法为主。与空气环境相比,水下环境中基于激光、红外线等原理进行深度采集的设备运用相对困难,不便采集与光学图像匹配的真实深度信息作为参考。深度学习作为一种以数据为驱动的技术,没有适合的可用数据集这一情况,导致了基于深度学习的水下单目深度估计方法的相关研究进展缓慢。针对上述问题,本文对基于深度学习的水下单目深度估计方法展开以下研究:(1)针对水下场景缺乏可参考深度信息问题,考虑使用无监督学习的方法将深度估计问题转换为图像重建问题来进行处理,借助双目立体视觉的图像重建原理,使用模型预测结果进行图像重建,以图像重建损失为主要损失函数来约束模型的权重。同时,考虑到水下环境复杂多变,直接对深度结果进行预测的难度较高,本文选择使用在预测结果上鲁棒性更好的离散化序数方法进行结果的预测,并提出了一种基于序数关系的水下场景无监督单目深度估计方法。该方法采用编解码器结构,首先在编码器部分对输入图像进行编码,提取高层特征,然后在解码器部分进行上采样,恢复底层特征,最后根据离散化的序数标签进行逐像素的分类,并以数学期望的形式计算出像素点的深度预测结果。其中,本文在编码器部分提出一种基于视觉注意力机制的奖惩模块,在不增加网络参数量的前提下,加强网络模型预测结果中的细节表现;还提出一种结合扩张卷积和场景编码金字塔的深度关联模块,通过对高维特征进行多尺度的融合,加强高维特征间的全局联系。由于包含深度信息的水下图像数据量小,本文使用地面环境的数据集进行网络预训练,再使用水下数据集进行迁移训练,获得有效的水下单目深度估计模型。(2)针对水下图像模糊度高、对比度低等常见图像退化问题对深度估计任务造成的不利影响,本文进一步提出了一种结合水下光学特性的改进水下单目深度估计方法。首先,结合传统水下图像增强方法设计了一种水下图像增强模块,优化输入网络的图像特征,使网络的预测结果更为合理;其次,优化了序数关系离散化的尺度,使模型的预测结果更符合水下环境中的深度分布;同时,使用计算原始水下图像和重建图像间误差的图像重建损失,以及基于水下图像成像原理提出的结合透射图计算的光度重建损失,为模型施加额外约束。基于上述的改进策略和新的损失函数,有效提高了网络模型的预测性能。本文系统地研究了基于深度学习的单目深度估计方法中细节特征被弱化的问题和面向水下环境的无监督单目深度估计方法,所提出的方法有效提高了网络模型的预测能力和对于水下环境的适应性,并通过充分的实验论证了本文方法的有效性。
其他文献
紧密子图查询作为图查询的研究热点之一,在很多领域都有着重要的应用。现有的研究中已有许多紧密子图查询方法,如基于模块度优化的算法、谱方法、非负矩阵分解等。对于紧密子图的定义也有多种,常见的有k架(k-truss)、k团(k-clique)、k核(k-core)等。其中k核的定义要求图中每个节点至少有k个邻接节点,即每个节点的度至少为k。根据该定义,k核可以在线性时间复杂度内计算得到,具有较好的应用基
学位
饲料中添加抗生素是防治腹泻的常用方法,然而长期以来由于大多数养殖场不合理使用抗生素导致耐药菌株产生、畜禽产品品质下降、人类食品安全遭受威胁等问题出现。我国农业农村部发布公告,自2020年1月1日起,禁用所有除中药外的促生长类饲料添加剂。因此,寻找能够替代抗生素的药物迫在眉睫。中草药来源广泛、种类丰富,具有抗病毒、抗细菌、提高免疫力等多种功效,并且毒性低、残留少、不易产生耐药性。综合"禁抗"的时代背
期刊
随着图像处理传感器与采集系统的快速发展,以及无人机在社会上越来越普及,人们获取无人机遥感图像的方式也越来越便捷。无人机遥感作为补充卫星遥感和有人机航空遥感不足的航空遥感手段,不仅可以获得正射遥感图像还可以获得倾斜摄影遥感图像。在很多领域中人们对遥感图像中的地物情况在语义上的精准分割都有着很大的需求,如城市建设、精准农业、灾情监测以及环境监测等各个领域。由于遥感图像中目标尺度多,网络高层次特征中小目
学位
受到生物特点和复杂环境等诸多因素的影响,长久以来浅海增养殖难以做到精准监测、检测和利用,我国浅海增养殖虽然经过长久发展,但养殖信息化和智能化程度低、大数据挖掘与分析技术薄弱,由于历史和现实原因,养殖数据具有资源途径多样、结构繁杂、质量参差不齐、应用范畴宽广、数据总体质量偏低的特点,现有浅海增养殖多依赖人工,这也造成了数据资源无法做到有效利用。近年来随着养殖大数据技术和生态学养殖的多元化发展,通过学
学位
蛋白质是生物体的必要组成成分,参与了细胞生命活动中的每一个进程,它的种类繁多且功能各异,准确预测蛋白质的功能对于疾病预防和药物开发等领域具有重要的意义。随着测序技术的发展,蛋白质序列数据呈指数级的增长。然而传统的实验方法费时费力,已经不能够满足如今大量蛋白质数据注释的需求。因此迫切需要使用计算的方法来快速、准确的预测蛋白质的功能。经过实验证明,PSI-BLAST profiles可以为各种蛋白质分
学位
<正>在企业"走出去"步伐加快、海外业务加速扩张的背景下,如何防范海外资金与市场风险、增强企业集团内外部流动性、提高企业资金的收益,是摆在跨国企业面前的一个重要问题。跨国公司在海外业务不断拓展与深化的情况下,借鉴境内现金管理的成熟经验,根据自身海外网络,选择领先的国际金融中心城市设立海外财资管理中心成为必然趋势。
期刊
全波形星载激光测高是一种主动式的远距离高精度探测技术,能够以极小的时间间隔记录地物的回波信号,提供激光光斑内精细的垂直结构信息及丰富的地表特征参数,有利于地表形貌描述和地物信息识别,也为地物分类提供一种可能,特别是对于偏远山区的地物调查。对于星载激光测高的全波形数据应用,其全波形回波信号的数据预处理及波形分解方法将直接决定激光测距的计算精确性和特征参数的提取准确性。但星载激光测高在激光脉冲传播中受
学位
海洋自然资源丰富,海洋的深度开发和利用已成为全球发展的新热点和竞争的新舞台。我国作为海洋大国,以科技创新了解海洋、认识海洋,进而开发海洋和经略海洋引领海洋发展,是建设“海洋强国”的重要支撑。中尺度涡作为一种普遍存在的海洋现象,广泛存在于世界大洋与边缘海中。由于中尺度涡大空间尺度、非规则三维立体结构以及水平与垂直快速运动特点,使其在全球海洋物质、能量、热量和淡水的输运和分配中起着不可忽视的作用。因此
学位
长鳍金枪鱼(Thunnus alalunga)主要分布在三大洋中的温带和热带海域,是一种大洋暖水洄游性鱼类,具有较高的营养价值和经济效益。中国、日本等国家进行长鳍金枪鱼渔业作业的主要海域位于太平洋南部,占整个太平洋海域长鳍金枪鱼产量的50%以上,并且近年来在南太平洋海域进行渔业资源开发的国家越来越多,金枪鱼渔业的发展引起了农业部的高度重视。开展对南太平洋长鳍金枪鱼渔场预报的研究能够降低长鳍金枪鱼中
学位
中国是拥有1.8万公里海岸线的海洋大国,沿海地区灾害性海浪频发,严重威胁近海民众生命财产安全。因此,近岸海浪的检测及预报对浅海生产作业以及保障我国沿海人民生命财产安全等方面具有重要意义。目前我国近岸海浪观测采用波浪浮标与人工观测相结合的方式,波浪浮标运行和维护成本高,人工观测的观测频率和精度难以保障;浪高预报业务多采用基于能量平衡方程的动力学方法,其建立在明确物理过程的基础上,而近岸海底地形复杂,
学位