论文部分内容阅读
人眼的视觉注意机制能够在复杂场景中快速准确地对目标和其他区域进行区分,源于不同物体对眼睛刺激程度的不同。显著检测是在对人眼视觉注意机制研究的基础上,利用计算机模拟人眼对不同区域的差异性感知来判断区域是否显著。显著检测在图像处理领域占有重要的地位,通过显著检测可以将图像中的显著区域和背景区域进行区分。目前,显著检测已应用到了图像分割、图像压缩、图像检索、场景重建等领域。显著目标检测领域所提出的方法可概括为自顶向下和自底向上。基于自顶向下的方法多依靠高层次的信息并经过神经网络的学习和训练模型来检测显著目标,而自底向上的方法多依靠图像本身的颜色、纹理、空间分布等特征的对比来区分背景和显著目标。但基于对比的方法主要是突出某一部分区域或抑制某一部分区域,很难形成有效的显著图。因此本文提出了基于迭代对比的RGB图像显著目标检测方法,并同时从背景和前景两个视觉互补的角度进行迭代对比,来提高方法的有效性和准确率。背景角度:本文在背景迭代对比的过程中依据背景先验将图像边界视作背景,并通过像素直方图对边界进行筛选,确定背景标签为背景迭代对比赋予初始值。基于背景角度的迭代对比抑制了与边界相似的区域并减少了显著目标出现在边界上的误检。前景角度:在前景迭代对比的过程中通过紧密度的计算和阈值分割确定前景标签为前景迭代对比赋予初始值,并将背景迭代对比的结果作为置信度,修正前景迭代对比过程的结果,保障抑制背景的同时能完整的突出显著目标。随着测距设备的逐渐完善以及深度信息在众多工业领域的应用,显著目标检测的对象也逐渐从RGB图像扩展到RGB-D图像。很多现有的RGB-D图像显著目标检测方法将RGB图像和深度图像分开进行处理,并将两部分的显著计算结果进行融合。虽然这样的方法取得了不错的效果,但当显著目标与背景的深度信息处于同一水平,通过深度图得到的显著计算结果将会是无用或者错误的,从而影响最终的检测结果。本文认为单独的使用深度特征进行显著计算并不能充分体现深度信息的优势,从而提出了多角度融合的RGB-D图像显著目标检测方法。多角度融合的框架包括颜色和深度的融合,全局和局部的融合以及背景和前景的融合。首先在像素级别和超像素级别同时进行颜色和深度的融合并构建特征融合的图模型,避免单独的颜色特征或深度特征所带来的误检。然后,根据全局和局部分别凸显目标整体和目标轮廓的特点,以颜色深度融合的特征关系指导全局紧密度和局部紧密度的计算,并将结果进行融合来提升显著目标检测的准确率。最后,根据背景和前景在视觉注意上的不同依次对显著计算的结果进行背景优化和前景优化,获取高亮均匀的显著图。本文在MSRA-1000、CSSD以及ECSSD三个公开的数据集对本文所提出的RGB图像显著目标检测方法和当前流行的RGB图像显著目标检测方法进行了验证和评估。实验结果表明本文方法在PR曲线和F-measure值上的评估都有明显优势。本文在RGBD-1000数据集上对本文所提出的RGB-D图像显著目标检测方法和当前流行的RGB-D图像显著目标检测方法进行了验证和评估。实验结果表明本文方法相对现有流行方法在PR曲线和F-measure值上的评估都有明显优势。