有限数据驱动的光场显著性目标检测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:uxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著性目标检测目的是识别出图像中最吸引人的对象或区域,是计算机视觉领域的重要任务。根据输入数据的类型,现有的显著性目标检测算法可以分为3类:RGB、RGB-D以及光场方法。与RGB以及RGB-D数据相比,光场数据包含丰富的场景信息,能够满足困难场景的信息需求。近年来,深度卷积神经网络的发展取代了传统基于手工特征的算法,显著提高了光场显著性目标检测的性能。然而实际场景中,较高的光场数据获取成本、极为复杂光场多线索信息处理以及耗时费力的显著性像素级标注,导致目前光场显著性目标检测数据稀缺,难以为深度模型提供足够的数据支持。针对上述问题,本文从高效利用光场信息以及增广光场数据两个角度出发,探索有限数据驱动的光场显著性目标检测方法。论文的主要工作及创新点如下:(1)面对如何高效的挖掘有限光场数据的挑战,本文提出了一种区域感知网络探索光场数据的方法。该方法主要包含两个模块:多源学习模块和聚焦度识别模块。其中多源学习模块充分考虑各个焦点切片不同区域对预测的贡献,在显著性、边界以及中心位置等多个指导信息下生成区域级的注意力权重,突出不同切片中聚焦的显著性区域,并根据生成的注意力权重整合焦点堆栈的特征。聚焦度识别模块充分考虑多聚焦特性对显著性的影响,通过判断各个焦点切片不同区域的聚焦度以优化和更新注意力权重,使得特征整合过程中进一步突出显著性区域的同时抑制非显著性区域带来的影响。相比现有方法,本文方法对光场数据进行区域级的探索,充分考虑不同区域对最终预测的贡献,更有效的利用了光场信息。(2)面对如何利用有限光场数据以及显著性标签完成光场数据增强的挑战,本文提出了一种基于数据增强的的光场显著性目标检测方法。该方法主要包含两个模块:几何增强模块以及聚焦性补偿模块。其中几何增强模块通过对抗训练学习场景的几何关系重新组合显著性对象以及背景图像增强光场数据。聚焦性补偿模块通过对抗训练学习将焦点堆栈多聚焦信息传递给风格迁移网络优化合成焦点堆栈数据的多聚焦信息细节。此外本文针对合成数据与真实数据的联合训练提出了不确定性学习策略,通过不平等的对待合成数据以及自然数据,避免低质量数据对网络训练的影响。相较于现有方法,本文的数据增强方法可以显著的提升基线网络的泛化性以及检测性能。
其他文献
<正>审计质量是审计工作的生命线,而审计项目质量更是审计质量的核心,所以抓好审计项目质量是审计工作的关键点。本文从审计项目质量监控概述、监控现状和如何强化审计项目质量监控措施三个方面,对基层央行审计项目质量监控进行分析。
期刊
<正>中国人民银行(以下简称人民银行)内审司业务审计处(以下简称业务审计处)以习近平新时代中国特色社会主义思想为指导,深入学习贯彻习近平总书记在中央审计委员会第一次会议上的重要讲话精神,组织、指导、监督和管理人民银行系统业务审计工作,不断提高工作质量,切实履行审计监督、评价和建议职责,在促进人民银行规范、高效履职方面发挥了积极作用。
期刊
X射线层析成像(Computed Tomography,CT)能够清晰呈现物体三维结构,因此被广泛应用于医学影像诊断和工业无损探伤等领域。但该技术也存在一定的局限,由于重建三维图像需要采集数以百计的投影,导致重建时间长、辐射剂量大。为解决以上问题,此前的研究从减少投影采集角度入手,提出了基于有限角度、稀疏角度甚至单视角进行CT重建的方法。尽管近年来深度学习的飞速发展加快了单视角CT重建的研究,但目
学位
随社会经济的飞速发展,陆地的许多资源已无法满足人们需要,对海洋资源的开发处于一个十分重要的战略地位。水声通信在海洋资源的环境勘探与开发等方面扮演着不可或缺的角色。相较陆地无线通信系统,水声通信面临更多挑战,如时延扩展长、带宽受限、多普勒效应显著以及快速时变等。为实现在复杂多变水声信道中的可靠通信,本文将正交时频空间调制(OTFS)与水声通信结合。针对OTFS水声通信系统中的信道估计与信道均衡技术展
学位
无线感知是一种通过分析受目标状态影响的无线信号来获取感兴趣目标状态信息的新兴非接触感知技术。该技术利用周围广泛存在的无线信号来对目标状态进行感知,其具有低成本、不受光照影响、隐私性较好等优点,因而使得其在智能家居、智能监护、人机交互领域有着广泛的应用前景。受深度网络在计算机视觉领域广泛应用并取得丰富成果的启发,无线感知技术近年来很多工作都倾向于采集无线数据集,然后基于数据构建无线射频图像数据集,接
学位
遥感图像目标识别是一种图像级的任务,目的是分辨遥感图像中物体的类别,在军事安全、海上交通等方面应用广泛。近年来,深度卷积网络在遥感图像识别任务中表现优异,相对于传统方法展现出巨大优势。目前,深度学习在遥感图像目标识别领域主要的研究方式为利用注意力机制获取辨识性特征或是加入检测、分割等子网络定位识别重点区域。然而,多数遥感图像目标识别研究仅适用于高分辨率遥感图像。针对低分辨率遥感图像目标识别准确度较
学位
随着资源需求的日益增加,世界各国愈发重视海洋资源的勘探与利用。水下无线传感器网络(Underwater Wireless Sensor Network,UWSN)作为开发利用海洋的重要技术手段之一,受到了学界和业界的广泛关注。但是,目前对水下无线传感器网络的研究仍面临诸多挑战,例如,水下传感器网络多功能节点的设计、网络节点的部署算法等。本论文围绕水下无线传感器网络的移动节点部署方法和水下多媒体信息
学位
显著性目标检测作为计算机视觉领域中的一项重要任务,对于图像高层语义的理解具备重要意义,为各类图像处理和计算机视觉相关任务提供了必要的先验知识。作为像素级图像分割任务,显著性目标检测非常依赖高质量、大规模的像素级标签作为数据支撑,其获取往往费时费力、代价高昂。因此,基于标注高效的图像级标签的弱监督学习近年来受到了广泛关注。现有工作大多关注于如何获取高质量的伪标签,而忽略了伪标签中广泛存在的噪声对于显
学位
虹膜识别使用人眼图像中虹膜区域丰富的纹理信息进行用户身份识别,是目前最安全、使用最广泛的生物识别技术之一。为了提升虹膜识别技术的性能,本文设计了基于深度学习模型的虹膜定位和识别方法,分别从虹膜定位、虹膜识别以及模型轻量化三个方面展开研究。首先,与现有的使用标准圆形拟合虹膜内外轮廓的虹膜定位方法不同,为了缓解标准圆形框无法准确定位变形虹膜的问题,本文设计了一个基于旋转椭圆框的虹膜定位模型,该模型在旋
学位
随着经济、科技和医疗水平的快速发展,社会人口老龄化愈发严重,老年群体的健康问题也随之凸显。跌倒已经成为老年群体意外伤害死亡的主要原因之一,若能及时对跌倒进行检测,则可以为救援提供宝贵的时间先机。本文基于计算机视觉技术,分别从人体的姿态建模和动作的时序建模两方面入手,充分挖掘了人体的姿态信息和动作的时序特征,提高了跌倒检测的准确率。首先,在姿态建模方面,现有的跌倒检测方法通常采用人体骨架来表征姿态。
学位