【摘 要】
:
场景的深度估计问题是计算机视觉领域中的经典问题之一,也是3维重建和图像合成等应用中的一个重要环节.基于深度学习的单目深度估计技术高速发展,各种网络结构相继提出.本文对基于深度学习的单目深度估计技术最新进展进行了综述,回顾了基于监督学习和基于无监督学习方法的发展历程.重点关注单目深度估计的优化思路及其在深度学习网络结构中的表现,将监督学习方法分为多尺度特征融合的方法、结合条件随机场(conditional random field,CRF)的方法、基于序数关系的方法、结合多元图像信息的方法和其他方法等5类;
【机 构】
:
上海海洋大学信息学院,上海 201306
论文部分内容阅读
场景的深度估计问题是计算机视觉领域中的经典问题之一,也是3维重建和图像合成等应用中的一个重要环节.基于深度学习的单目深度估计技术高速发展,各种网络结构相继提出.本文对基于深度学习的单目深度估计技术最新进展进行了综述,回顾了基于监督学习和基于无监督学习方法的发展历程.重点关注单目深度估计的优化思路及其在深度学习网络结构中的表现,将监督学习方法分为多尺度特征融合的方法、结合条件随机场(conditional random field,CRF)的方法、基于序数关系的方法、结合多元图像信息的方法和其他方法等5类;将无监督学习方法分为基于立体视觉的方法、基于运动恢复结构(structure from motion,SfM)的方法、结合对抗性网络的方法、基于序数关系的方法和结合不确定性的方法等5类.此外,还介绍了单目深度估计任务中常用的数据集和评价指标,并对目前基于深度学习的单目深度估计技术在精确度、泛化性、应用场景和无监督网络中不确定性研究等方面的现状和面临的挑战进行了讨论,为相关领域的研究人员提供一个比较全面的参考.
其他文献
目的 由于空域图像下采样过程中提供的量化误差边信息能够有效提升隐写安全性,为了得到下采样之前的高分辨率图像,提出一种基于超分辨率网络的空域图像边信息估计隐写方法.方法 受原始下采样边信息隐写方法的启发,使用超分辨率网络生成被称为预载体的高分辨率图像.同时利用现有的空域图像对称失真算法得到每个像素点的修改失真,然后以浮点型精度对预载体下采样,得到和载体同分辨率的图像形式,利用对应像素点间的差值指导像素点的修改方向,实现基于初始失真的非对称失真调整.首先以峰值信噪比和极性估计准确率为指标对比了多种超分辨率网络
农贸市场是农产品流通和消费者购买食材的主要场所之一,农贸市场的食品安全性与人们的健康相关.农贸市场的食品安全监管工作存在一定的缺失,市场秩序较为混乱,出现了较多的食品安全问题,如滥用添加剂等,引起了社会各界的广泛关注,做好农贸市场的食品安全监管工作非常重要.基于此,本文分析了农贸市场食品安全监管存在的问题,并阐述了解决策略,以期为提高农贸市场的食品安全监管水平提供参考.
(简讯 范庆伟 朱有刚)日前,山东省栖霞市市场监管局在烟台开发区鑫源绿环再生资源股份有限公司组织开展了全市“农村假冒伪劣食品专项执法行动罚没物品集中销毁现场会”.
目的 传统Krawtchouk变换处理图像时存在变换域信息表示单一、不可调节等问题,传统分数阶Krawt-chouk变换处理实信号表示有冗余等问题.为了构造更加灵活的图像变换域表示,提出了实离散分数阶Krawt-chouk变换,并应用于数字图像水印.方法 利用对传统Krawtchouk变换矩阵特征值分解的方式,通过对分解后的特征值矩阵的实矩阵分数化构造得到了实离散分数阶Krawtchouk变换的变换矩阵,从而构造出实离散分数阶Krawtchouk变换.然后,利用所提变换从实数域变换到实数域这一特性,提出了
目的 本征图像分解是计算视觉和图形学领域的一个基本问题,旨在将图像中场景的纹理和光照成分分离开来.基于深度学习的本征图像分解方法受限于现有的数据集,存在分解结果过度平滑、在真实数据泛化能力较差等问题.方法 首先设计基于图卷积的模块,显式地考虑图像中的非局部信息.同时,为了使训练的网络可以处理更复杂的光照情况,渲染了高质量的合成数据集.此外,引入了一个基于神经网络的反照率图像优化模块,提升获得的反照率图像的局部平滑性.结果 将不同方法在所提的数据集上训练,相比之前合成数据集CGIntrinsics进行训练的
目的 深度伪造是新兴的一种使用深度学习手段对图像和视频进行篡改的技术,其中针对人脸视频进行的篡改对社会和个人有着巨大的威胁.目前,利用时序或多帧信息的检测方法仍处于初级研究阶段,同时现有工作往往忽视了从视频中提取帧的方式对检测的意义和效率的问题.针对人脸交换篡改视频提出了一个在多个关键帧中进行帧上特征提取与帧间交互的高效检测框架.方法 从视频流直接提取一定数量的关键帧,避免了帧间解码的过程;使用卷积神经网络将样本中单帧人脸图像映射到统一的特征空间;利用多层基于自注意力机制的编码单元与线性和非线性的变换,使
目的 结构化重建,即从离散点云或者原始三角网格中提取几何平面并将其拼接成紧凑的参数化3维模型,一直是计算机图形学领域中极具挑战性的问题.现有方法通常面临着两个挑战.一是传统的形状检测方法通常只考虑物体的局部特征,无法保证整体结果的准确性.二是现有的形状拼接算法往往受限于计算复杂度,从而只能处理由一百多个几何平面组成的物体,极大地限制了算法的应用场景.针对这些问题,提出了一种快速、鲁棒的结构化重建算法以自动地生成轻量的多边形网格.方法 提出了一种多源区域增长算法,全局地从原始3维数据中提取特征平面.该策略保
本文通过研究pH值、微波时间及微波功率等因素对莜麦麸 β-葡聚糖提取率的影响.根据单因素和正交试验,确定了提取的最佳条件为pH值11,微波功率600 W,微波时间180 s,提取温度75℃,在此工艺下β-葡聚糖提取率为3.472%.
本文建立了高效液相色谱法测定糕点中富马酸二甲酯的方法,试样经氨水甲醇溶液超声提取,滤纸过滤,过有机相滤膜,采用C18色谱柱分离,二极管阵列检测器检测.结果 表明,富马酸二甲酯在1.0~30.0μg/mL线性关系良好,相关系数为0.999607,方法检出限为0.05 mg/kg,加标回收率为92.5% ~98.4%,RSD为0.37%~1.60%,满足糕点中富马酸二甲酯准确、快速、高通量的检测需求.
目的 物联网(internet of things,IoT)感知层获取数据时存在资源受限的约束,同时数据常常遭受泄露和非法篡改.数据一旦遭到破坏,将对接收者造成很大的影响,甚至可能会比没有收到数据更加严重.针对IoT数据获取面临的能耗和安全问题,提出一种基于半张量积压缩感知的可验证图像加密方法.方法 首先采用级联混沌系统生成测量矩阵和验证矩阵,测量矩阵以半张量积压缩感知的方式进行采样得到观测值矩阵.利用Arnold置乱观测值矩阵得到最终密文信号,与此同时由验证矩阵生成消息验证码一同在公共信道传输,将由级联