基于特征融合的RGB-D显著目标检测算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:krizy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著目标检测旨在模拟人眼的视觉机制,检测并分割出一幅图像中最吸引人注意力的目标。近年来,这项基础性的工作在很多计算机视觉领域中都发挥了重要的作用,比如行人重识别、弱监督语义分割、物体识别等领域作为图像预处理技术。虽然基于RGB图像的显著目标检测获得了很大的进展,但在复杂场景下检测效果仍需要改善。随着RGBD传感技术的发展,能够获得RGB彩色图像的同时获得相应的深度图像信息。由于深度信息能够使网络感受多层次的信息,并且当RGB图像对比度很低的时候,深度图像能为其提供补充信息。因此,RGB-D显著目标检测近年来得到了广泛的关注和研究。本文主要对基于特征融合的RGB-D显著目标检测算法进行研究,为了研究如何更好地融合RGB信息和深度信息,给出了两种深度学习网络模型。其中第一个模型基于解码器之间的特征融合,在这个网络中,为了将信息更好地向前传播,在抑制与显著特征无关的信息同时,并增强与当前任务有关的显著信息,主要是引入了残差融合模块来提高网络的检测效果,此外,还加入了子像素卷积层来完成图像特征由低分辨率到高分辨率的转变,将插值函数隐含在卷积层从而提高网络的效率,最后在网络中加深监督来提高算法的性能;第二个模型基于编码器之间的特征融合,引入了不对称注意力机制来将编码器的特征进行加强,从而在RGB图像信息和深度信息之间紧密地分层交互,通过在通道层面和空间层面给予不同的重要性权重,使得网络对编码器的特征进行选择和转换,进一步将其馈送到解码器以实现细分效果,最后为了增强显著目标检测的轮廓,利用边缘检测任务来辅助显著目标检测,通过边缘损失函数加强其在边界上的效果,从而实现端到端的训练。上述两种算法均在公开的数据集上进行测试,并与近年来优秀算法做了实验对比,取得了比较不错的结果。
其他文献
随着科技的发展,机动车的数量在极速增长,随之而来的交通事故、交通堵塞、空气污染以及能源浪费成为了不容忽视的问题,为提高道路承载能力、提高道路交通效率、减少车辆能耗消耗以及降低空气污染保护环境,车辆编队成为了道路交通中重要的驾驶方式,也是学术界重要的研究课题。本文针对车辆编队问题,对车辆编队构型过程进行了聚类设计,在基于MEC的车联网络架构下,实现了以能耗为优化目标的编队构型形成过程,本文具体的研究
CAD系统的广泛应用使得企业积累了大量的CAD产品模型。CAD模型检索技术能够促进模型的重用并加快企业中产品的设计。产品模型常常以不同的格式存储,并使用标准格式在不同CAD系统间进行交换,本文研究了一种标准格式CAD装配体模型的检索方法,可同时用于标准格式和各种商用格式CAD装配体模型的检索。研究了基于零件模型参数矢量的装配体检索方法。从零件模型中直接提取一些参数,通过归一化这些参数构造零件模型参
材料微观结构表征与重建(Microstructure Characterization and Reconstruction,MCR)可用于建立加工-结构-属性(Processing-Structure-Property,PSP)关系,是计算材料学与材料设计的研究重点。多相非均质材料广泛应用于航空、电气、地质、医学等领域中,利用MCR方法能够获得该材料的大量统计等效模型,为构建材料的PSP关系提供
人体的三维建模与表示是计算机视觉与计算机图形学领域的一个经典问题。该问题已经被研究了很久,且有许多杰出的工作。人体具有复杂的几何结构,多样的动作,三维人体的表示也丰富多样,如网格,体素,点云等,以及近些年的学术成果——参数化人体模型。对于三维人体的视觉重建任务,研究人员往往依据人体表示的不同进行人体重建算法的构建。人体重建算法分为裸体人体的重建以及具有个体化特征如衣服、头发等几何细节的人体模型的重
近年来,深度学习在医学影像处理方面应用愈发广泛,二者的结合促使临床诊断方式发生改变。目前医学影像技术中磁共振成像(Magnetic Resonance Imaging,MRI)凭借良好的软组织分辨率和空间分辨率等优点,成为临床检查的常用手段之一。然而,在MRI成像过程中,由于患者不自觉运动容易产生图像间的非刚性形变,严重影响生成图像间的解剖对应关系。本论文旨在利用基于深度学习的配准技术,解决MRI
随着人们对产品设计方面的要求越来越高,许多产品在制造之前都要进行相应的曲线曲面的几何造型设计,例如汽车的车壳设计、飞机的机翼的设计,还有日常中人们穿的鞋子、衣服等,这些都属于曲线曲面造型的研究,曲线曲面造型的研究也一直是计算机辅助几何设计(CAGD)研究的核心内容。另外利用插值、拟合、逼近、拼接等方法研究满足某种性质的曲线曲面在实际应用中也是非常重要的。在曲面建模中,近20年来,自由曲线曲面的设计
随着移动互联网的普及和5G的飞速发展,网络上数据规模呈指数增长,数据的价值也被不断挖掘利用。数据中心作为数据进行传递和存储的基础设施,正在承载着这些复杂的网络数据。随着数据规模日益增长,在庞大的网络数据和高速网络传输面前,如何对网络进行流量实时获取、分析、存储是网络流量分析必须要面临的挑战。如何在不影响正常业务数据的情况下,高效完成对整个数据中心流量进行采集分析,是一个热点问题。目前传统的实时流量
在位测量与反馈加工一体化是保证曲面轮廓精度的有效手段,在机测量将测量点云和模型点云进行配准后进行余量求解生成G代码反馈至机床完成误差补偿,因此点云配准和余量精确求解将直接影响在位测量的准确度,是在位测量及反馈加工数据处理中至关重要的一个步骤,也是反馈加工过程中重要环节之一。然而,点云配准对于初始位姿有较高的要求并易陷入局部最优,会影响点云配准的精确度。另一方面,目前大部分的余量求解算法以点为三角面
随着城市交通系统中车辆数量的增加,交通系统面临着一些列问题,比如交通拥堵、出行时间过长、交通事故率提高等。基于车联网(VANET)技术产生的智能交通系统(ITS)使得这些问题有了一定的缓解。然而随着车辆数量的持续快速增加,传统ITS的运行效率正不断降低,迫切需要新的技术支持来提高解决交通问题的效率。在此背景下,SDNbased VANET(基于软件定义网络的VANET)框架应运而生。SDN-bas
雨天条件下受到雨线或雨条的影响,拍摄的图像会退化,信息遭受破坏和丢失,使得图像的视觉能见度下降,图像成像模糊或失真。在现实世界的工作任务中,往往需要高质量的图像,并且退化图像限制了室外高级视觉处理算法,例如目标检测,图像分割等应用。因此,开发一种有效的图像去雨算法,从有雨的图像恢复出无雨图像,是一个亟待解决的问题。图像去雨作为计算机视觉系统中的底层处理任务,在当前阶段具有十分重要的研究价值。然而,