论文部分内容阅读
当面对外界的场景时,人眼视觉系统能够迅速地捕捉到感兴趣的目标区域。随着计算机技术和人工智能的不断发展,计算机视觉得到了人们的广泛关注,其主要目的就是借助计算机模拟人类视觉系统来认知和理解世界。显著性目标检测作为计算机视觉研究领域的一项重要环节,旨在获取图像中的视觉感兴趣区域。作为图像的预处理步骤,显著性目标检测能够大大缩小图像的处理范围从而降低场景分析的复杂度,因而在图像分割、图像分类和图像识别等计算机视觉领域具有广泛的应用价值。然而,由于图像中的复杂场景、目标种类不同等技术性难点,如何准确高效地检测出复杂场景的显著目标仍是一项具有挑战性的研究课题。本文在前人研究工作的基础上,详细总结和介绍了已有的与本文工作相关的显著性目标检测算法,分析了传统的基于低秩表示的图像显著性目标检测算法存在的不足之处,提出了一种基于结构低秩表示和背景驱使的显著性目标检测算法,最后在公共标准数据库上设计实验从而验证本文提出的算法的有效性。首先,本文对图像显著性检测领域的研究现状和发展趋势进行了总结,重点介绍了三种相关的主流算法,分别是基于鲁棒背景检测的显著性优化算法,基于稠密和稀疏重构误差描述子的显著性目标检测算法和基于结构矩阵分解的显著性目标检测算法,并指出了这三种算法的优缺点。然后,针对已有的算法在图像场景较为复杂时无法构建更加准确的背景字典,并且传统基于低秩表示的算法没有考虑复杂背景子区域的低秩性和显著目标区域的内在结构进而难以准确地检测出显著目标等问题,本文提出了一种基于结构低秩表示和背景驱使的图像显著性目标检测算法。该算法主要包括:(1)将输入图像过分割为一系列超像素,提取每一个超像素的颜色、边缘、纹理特征构建图像的特征矩阵;(2)利用图像分割算法构建图像的树型结构;(3)基于VGG16卷积神经网络构建背景字典;(4)基于结构低秩表示模型重构图像的特征矩阵,结构低秩项约束图像子区域的一致性,组稀疏项约束重构误差的组稀疏特性,拉普拉斯正则项约束潜在显著目标区域的一致性;(5)基于低秩表示系数和稀疏重构误差联合构建显著图。最后,在Windows 7环境下采用Matlab编程语言,实现本文提出的算法。使用MSRA10K、ECSSD和DUT-OMRON这三种数据库将本文算法与其他主流图像显著性目标检测算法进行比较,其中包括4种基于深度学习的图像显著性目标检测算法进行比较,设计相应的对比实验,同时进一步分析和验证了本文算法的有效性。实验结果表明,面对复杂场景或对比度低的图像,本文提出的算法不仅能够检测出更加完整一致的显著目标,还能更好地抑制背景噪声。