基于数字重聚焦原理和深度线索的显著性目标检测方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:xiaofch22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著性目标检测是一项基于人类视觉注意理论的计算机视觉任务。光场显著性目标检测作为其新兴的一个分支,以光场提供的丰富图像类型为数据来源,通过充分提取场景包含的特征来准确地识别并分割出场景中吸引注意力的完整物体,提高在复杂背景、复杂光照、物体与背景相似等挑战性场景下的性能。研究表明,颜色、方向、运动、深度和聚焦都是影响视觉注意的因素。由于光场所提供图像类型的特殊性,现有基于深度学习的方法只基于上述部分因素进行特征提取,以降低网络的计算负担。然而,无论是基于重聚焦图像类型的方法还是基于多视角图像类型的方法,都未能在特征提取过程中充分利用光场特性、尽可能地减少光场的冗余信息。本文围绕如何充分、高效地利用光场特性进行显著性目标检测,从不同图像类型提供的信息入手,主要开展了以下四个方面的研究:(1)提出一种基于焦点堆栈的3D-2D混合卷积网络,从焦点堆栈中充分提取连续变化的聚焦线索来检测显著性目标的同时极大地降低了网络所需的计算量。与现有基于重聚焦图像类型的深度学习方法相比:无需输入全聚焦图像,网络结构更简单;使用3D卷积从焦点堆栈中提取特征,更好地保留了聚焦线索;为整个焦点堆栈生成一幅显著图,计算更高效。实验结果表明,该网络在光场显著性目标检测数据集上能够精确地检测出显著性目标。(2)提出一种基于数字重聚焦数据增强的显著性目标检测网络,融合颜色、方向、聚焦、边缘和深度特征,实现了高效的显著性目标检测。与直接输入焦点堆栈的方法相比,该方法将数字重聚焦原理作为数据增强的手段,在网络训练过程中,只需输入重聚焦图像和深度图,使光场显著性目标检测任务转化为RGB-D显著性目标检测任务,极大地降低了网络训练时的计算负担。同时,为兼顾RGB显著性目标检测任务,在测试阶段支持只输入RGB图像。实验结果表明,该网络在3种显著性目标检测数据集上均取得了良好的检测效果。(3)提出较小规模的光场显著性目标检测网络。本文的方法针对现有方法没有考虑网络在移动设备上的可移植性、网络计算高效的问题,在网络设计的过程中,始终结合当前数据的特性,尽可能地设计规模较小地网络。实验结果表明,本文的网络在取得良好检测精度的同时,具有较小的规模。(4)探究在多个基线上训练的差异。本文的方法针对现有方法在不同基线上进行训练的问题,在3个具有代表性的基线上进行训练,比较不同基线上训练得到模型的差异,为后续工作选择基线提供参考。
其他文献
近些年来,在“斯诺登事件”、“美起诉中国人民解放军军官”和“白宫人事局窃密”等的冲击下,网络安全的战略重要性显著上升,已成为中美国家安全对抗的新前沿。为此,习总书记在某次网络安全会议上指出:没有网络安全就没有国家安全。隐蔽通信是实现网络安全的重要技术之一,特别是随着音频大数据时代的到来,网络上存在的海量音频载体使得音频隐写更加方便,基于音频隐写的隐蔽通信在保障信息安全和保护通信行为隐私方面的作用也
学位
超表面是由亚波长结构以周期或准周期形式,排列组成的二维微纳光学功能器件,可用于对电磁波的振幅、相位、偏振态等基本特性进行调控。当前,全介质超表面由于其损耗低的优势,被广泛应用于成像、通信、传感、军事等领域。然而,全介质超表面的纵横比例较大,在加工制备过程中产生的结构误差难以避免,可能导致超表面的功能发生畸变。针对此问题,本文开展了两项工作:(1)提出一种基于介质柱砷化镓超表面的集成高效红外透镜器件
学位
行人重识别旨在判断非重叠视域监控图像或视频序列中是否存在目标行人,现已成为智能监控分析系统中极为关键的一环,被广泛应用于公安防控领域,如城市交通平台监控、公安刑事侦查等场景。早期的研究致力于解决人体姿态、背景遮挡、监控视角、光线变化等因素对行人重识别的影响,却忽略了分辨率差异的问题。在真实世界中,由于行人与相机间的距离变化、相机硬件参数设置以及相机部署位置的不同,导致捕获到的行人图像分辨率低下,而
学位
水下光学成像在深海救援、资源开发等人类活动中有广泛的应用,是获取水下信息的重要手段之一。而光在水下的传输规律是光学成像领域的研究热点,由于光在水下传输时会受到水分子及悬浮粒子的吸收和散射作用,导致光的能量以及偏振特性发生改变,严重影响了水下目标的探测。为了提高光在水下的探测能力,本文从光在水下的传输规律以及水下图像复原两方面开展了研究工作。结合蒙特卡洛仿真与实测实验,开展了不同波段光在水下的传输实
学位
医学图像分析属于计算机视觉的一个子领域,其处理对象一般是通过不同成像手段得到的病灶或器官的医学影像。在目前的临床实践中,医生们常用的手段是依靠人眼观察医学成像的某些局部特征来发现病原体,这种方式十分依赖医生的经验,并且带有极强的主观因素。近年来,计算机辅助诊断系统已经广泛应用到了医学实践当中,通过计算机视觉和人工智能技术能够自动化地处理某些问题,如肿瘤病理学识别、疾病组织检测等,这些技术可以辅助甚
学位
偏振光为自然界中的生物提供了最为丰富的偏振信息。各种生物利用光的偏振现象进行远距离导航觅食、种群交流、寻找配偶以及返回巢穴等行为。偏振光也对人类的生活具有重要的作用,主要应用在偏振医疗、偏振光导航、偏振遥感探测以及偏振器件等众多领域。为了解决仿生偏振导航中的太阳位置获取问题,通过对大气偏振模式的E矢量分布特征的分析,分别提出了利用大气偏振模式结构相似性特征获取太阳位置和利用卷积神经网络实现天空偏振
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种高分辨率成像传感器,能够提供丰富的地物信息。与光学图像相比,SAR图像可以在全天候、全时条件下获得更有效、更全面的地物信息,从而有效提高了地物分类的能力。因此,现阶段SAR图像地物分类在相关领域扮演着越来越重要的角色。本文立足于SAR图像分类的主要问题——图像预处理以及分类,开展了SAR图像地物分类算法的关键技术研究。
学位
人体皮肤表面积(Body Surface Area,BSA)在体质评价、运动训练,尤其是医学领域等都有着广泛的应用,是一个重要的生理参数。烧伤患者的治理、用药量的定量计算等都需要用到人体皮肤表面积。然而传统的体表面积计算方法往往存在着指示性状较少、计算模型单一、数据集多是欧美人为主等问题,导致临床应用存在精度低的问题。三维扫描获得的体表面积精度较高,但其也存在着花费高、耗时长等问题。而随着深度学习
学位
异常行为检测是计算机视觉方向一项复杂的任务,该任务的目的是从真实场景的监控视频中自动检测出不符合正常行为规范的运动片段,这对于构建智能安防监控系统有着重要的应用价值。异常行为检测的难点在于真实场景中行为异常与否的判断会受到周围场景与其他运动个体的影响,难以通过直接分析运动特征进行判断。本文在总结现有异常行为检测方法的基础上,考虑异常行为的社会力模型,以及正常与异常行为的特征差异性,从真实场景的监控
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动式的遥感微波技术,能对识别目标进行全天时、全天候的监测,被用于军事侦察、地理测绘等多个领域。SAR图像高精度分类作为SAR图像解译的重要一环,一直受到国内外研究人员的关注。随着图像分辨率的快速提高,使原本适合中低分辨率的SAR图像分类算法,难以适应高分辨率SAR图像的处理需求。针对该问题,本文在了解SAR成像原理的基
学位