论文部分内容阅读
当面对复杂场景时,人眼视觉系统能够快速地从复杂场景中选择出感兴趣的目标,显著性检测旨在让计算机去模拟人眼视觉系统,检测出场景中人眼所感兴趣的目标区域,在图像及视频压缩、目标分割、目标的识别与跟踪等领域具有广泛的应用价值。本文在前人研究工作的基础上,总结传统的基于低秩和稀疏表示的显著性检测算法存在的不足之处,并结合图像和视频自身的特点,分别提出了相应的显著性目标检测算法,最后在公开测试数据集上通过实验验证了本文算法的有效性。本文的主要工作包括: 首先对图像和视频显著性检测领域的主要方法进行总结,重点探讨了三种基于低秩和稀疏表示的显著性检测算法,这三种算法分别是基于多任务低秩表示的显著性检测算法、基于低秩稀疏分解的空间平面模型和基于特征重构的时空显著性检测算法,并指出三种算法的优缺点。 然后针对传统的基于低秩稀疏分解的显著性检测算法难以完整一致地检测出较大尺寸的显著性目标问题,提出一种基于低秩和稀疏表示的图像显著性目标检测算法。 该算法主要包括如下步骤: (1)提取超像素的颜色、边缘和纹理特征构建特征矩阵; (2)根据超像素的边界连接度粗略地构建前景和背景字典; (3)基于低秩和稀疏表示模型分解图像的特征矩阵,利用低秩项约束超像素间的全局一致性,稀疏项约束重构系数的稀疏特性; (4)通过前景和背景重构系数的差异性构建显著性因子。实验结果表明,本文算法不仅能够完整一致地检测出场景中较大尺寸的显著性目标,且具有较强的抑制复杂背景的能力。 最后针对已有算法无法有效抑制复杂背景噪声,同时难以完整一致地检测出视频中的显著性目标问题,提出一种基于稀疏表示的视频显著性目标检测算法。 主要包括如下步骤: (1)提取超像素的时间和空间特征构建视频帧的时空特征矩阵; (2)基于Appearance模型和运动特征对比度构建视频帧的背景字典; (3)在构建背景字典的基础上,将视频帧的显著性目标检测问题转化为基于背景字典的非负稀疏重构问题,并通过对比度先验矩阵约束超像素的重构系数,同时结合拉普拉斯正则项约束邻域超像素重构系数的一致性; (4)融合基于重构系数和重构误差的显著图得到最终的显著性检测结果。 实验表明,相比于已有算法,本文算法针对目标较大或背景也存在复杂运动的情况,可以有效抑制复杂背景运动带来的干扰,且能够准确地检测出整个显著性目标。