显著物体检测计算方法及其应用

来源 :南京理工大学 | 被引量 : 1次 | 上传用户:feihuaxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类视觉系统从外部世界接收到海量的视觉输入信息,选择性注意机制使人类具有从中抽取出重要信息并实时诠释复杂场景的能力。在过去几十年里,心理学家和生理学家们一直试图研究和揭示选择性注意的内部机理,并提出了视觉显著性这一概念,已被广泛地应用于诸如目标识别、视频摘要、图像压缩、图像编辑、视觉跟踪等众多计算机视觉任务中。作为视觉显著性计算的研究分支,显著物体检测旨在从场景中检测出显著的物体并得到这些物体的精确分割,一个好的显著物体检测方法应同时满足高检测性能和低计算复杂度的要求。深入研究显著物体检测技术,可以逐步跨越底层特征与图像内容之间的鸿沟,使高层的场景理解成为可能。本文围绕显著物体检测技术与应用展开了相关研究,提出了两种显著物体检测方法和一种协同显著物体检测方法,并将显著性技术应用于单帧彩色图像小目标检测任务中。本文主要工作和创新点包括:
  (1)提出了一种基于区域主色的显著物体检测方法。该方法首先对原始图像在RGB空间进行最小方差量化,在LAB空间度量颜色差异,计算量化颜色的全局显著性;然后对最小方差量化图像进行超像素分割,将区域内频数最高的颜色作为区域主色计算局部显著性;最后计算区域间距离以及区域与图像中心间距离,并基于这两种空间关系对局部显著性加权。实验结果表明,该方法可在更少的颜色数下获得更好的检测性能,并降低了算法复杂度。
  (2)提出了一种基于颜色名空间的显著物体检测方法。该方法首先将原始图像从RGB空间转换到颜色名空间,在对颜色名通道序列化阈值分割的基础上,采用环绕性线索对图形一背景分离计算显著图;然后将原始图像转换为颜色名图像,计算全局颜色名统计特征和对比特征,并与环绕性线索结合计算加权显著图;最后,对显著图与加权显著图采用高亮截断的线性融合和后处理,得到显著物体区域。实验结果表明,该方法可弥补仅基于环绕性线索检测显著物体的不足,并在突出显著物体区域的同时抑制非显著的背景区域。
  (3)提出了一种基于分层结构与颜色名的协同显著物体检测方法。该方法首先对原始图像构造三个图像层,并融合颜色名和背景线索计算单层显著图;然后基于显著一致性和颜色名稀缺性对单层显著图融合并改进,计算单图显著图;最后对单图显著图采用自适应的阈值分割得到显著区域,并基于颜色名相似性去除非协同显著区域获得协同显著图。除可用于检测协同显著物体外,该方法也是一种针对单张图像的显著物体检测方法,实验结果表明提出的融合机制和颜色名线索的有效性。
  (4)针对显著性的具体应用,提出了一种融合区域稳定性与显著性的单帧彩色图像小目标检测方法,标注发布了一个用于单帧彩色图像小目标检测的基准数据库,并提供了相应的性能评估代码。该方法首先构造五种区域描述子和四个稳定性度量准则,并基于区域稳定性度量,在提取候选小目标的同时得到目标区域精确的特征描述;然后采用局部颜色差异计算像素级显著性,在突出小目标的同时抑制背景区域;最后,融合算法基于候选小目标的平均显著值剔除虚警目标,得到小目标检测结果。实验结果表明,该方法可有效弥补仅基于稳定性或显著性检测小目标的不足,以及融合算法的性能优势。
其他文献
智能监控系统通过结合人脸识别、目标检测与跟踪、异常检测等技术被广泛应用于众多相关领域。与此同时,在我国日趋复杂的工业网络结构中,监控视频在工业安防和工业质检等方面的作用愈加重要。然而,随之产生的海量监控视频的传输和存储给网络带宽、内存资源等方面也带来了极大的挑战。因此,保证监控视频的高效应用并提高压缩与重构效果,具有重大的应用和商业价值。  本文在分块压缩感知理论的基础上,根据监控视频自身及其应用
学位
数据压缩是指在保持数据的信息熵的条件下将数据量进行削减。因为深层自编码神经网络擅长于理解数据并对数据进行抽象表征,能够有效地对复杂数据进行压缩。为了能够将人耳听觉所能捕捉的所有频段作为输入,必须输入超长的音频信号采样,进而导致自编码网络的性能下降问题,本文提出了动态残差网络用于音乐音频有损压缩,优化了深度自编码网络模型,提出了一种结合注意力机制和残差学习的量化方法,从而实现了音频信号的压缩量化,同
学位
当代制造业等行业的高速发展,对传统金属材料的品质提出了更加苛刻的要求。在航空航天应用领域,复合材料因其优越的综合性能受到了广泛的关注。然而,在材料的长期服役以及所处工作环境的影响,材料表层及内部的原生缺陷以及在线工作引发的材料损伤等问题层出不穷。如何及时有效的发现材料中的缺陷损伤,是避免危险事故发生的重要前提。  针对无损检测的原位、非接触、远距离等实际需求,基于激光超声的无损检测技术能够较好的满
学位
多目标优化问题是科学研究和工程实践领域中的难题和热门问题。近年来,多目标进化算法(MOEAs)已经在多目标优化问题中取得了较好的应用,经典的多目标进化算法有非支配排序遗传算法(NSGA-II)和基于分解的多目标进化算法(MOEA/D)。这些算法能有效的解决无约束或者简单界约束下的多目标优化问题。未来,如何有效改进经典的多目标优化算法或者提出新的约束多目标优化算法,进而迭代求解复杂约束多目标函数成为
本文基于结构L增益奇异值方法,研究了结构不确定非线性系统的鲁棒性分析与综合问题,并以一些新的观点重新看待非线性H问题,讨论了其它增益问题与非线性H问题的内在联系.基于结构L增益奇异值进行的鲁棒分析与鲁棒综合,其基本依据是奇异值的边界特性,本文针对奇异值的上界特性给予了证明.本文重点研究了鲁棒稳定问题,得到了鲁棒稳定的充分条件,并讨论了保守性的影响.研究表明鲁棒分析中存在的保守性不仅和不确定性的结构
本文的第一部分是人脸识别技术综述。首先介绍了人脸识别技术的研究内容、历史、应用背景以及目前主要采用的人脸实验数据库的情况。并在此基础上阐述了人脸识别的各个步骤的主要任务和难点。 本文的第二部分主要对人脸检测和人眼定位的方法做了研究。介绍了目前的人脸检测的主要的算法。并详细介绍了两种不同的人脸检测和人眼定位算法。一种可以称为是自下而上的办法,即根据脸部的特征如人眼等来检测人脸的位置;另一种可以认为是
学位
作为计算机视觉领域的重要问题之一,以视频序列为载体的目标跟踪在动作识别、行人分析等应用中居于核心地位,同时其问题复杂性也让研究工作充满挑战。本文首先从历史语义信息和连续决策过程两个方面对跟踪问题的本质进行理解:即跟踪过程应为连续的决策过程,且视频序列提供的历史语义信息为后期决策提供支撑的同时也带来冗余。接着,基于该本质理解,总结出现有跟踪研究工作中的一些局限性:历史语义信息在时间与空间上的局限性,
学位
在实际应用中存在很多有自利agent参与的场景,多agent协作无论在工程领域还是在管理领域都有着广泛的应用。联盟技能博弈是一个典型的多自利agent系统。通过对联盟技能博弈的深入而系统的研究能为其他自利agent的管理和协作问题提供理论和方法支持。  完成的主要研究工作和成果总结如下:  (1)给出联盟技能博弈的一般模型,根据影响联盟值的因素将联盟技能博弈模型分为特征函数联盟技能博弈和划分函数联
随着越来越多的无线传感器融入到人们的生活,室内位置服务已广泛应用于各种场合,包括老人健康照护、火场救援以及安全监控等。在诸多技术中,基于射频的无设备被动定位因为无需携带任何设备就可实现室内人员的定位和追踪,具有隐式感知、非侵入性的特性,能够提供良好的隐私保护。由于室内环境的复杂性,如噪声干扰、碰撞冲突等,容易引起丢包并对定位精度产生影响。为提高精度,现有被动定位方法通常部署过多的传感器节点,从而造
随着无线传感器网络(Wireless Sensor Networks,WSNs)技术的发展,WSNs已经被广泛应用到与人们生活息息相关的许多方面,例如远程医疗监控、智能交通和环境监测等。WSNs中的节点通常随机部署在无人看守的监测区域,用于监测该区域发生的事件,并通过无线信道反馈给基站。所以怎样确保传感器节点的安全是WSNs的研究重点之一。传统的密码学方法能有效防御外部攻击,而内部攻击目前主要通过