论文部分内容阅读
视频显著性检测是指检测视频序列帧中最引起人眼关注的区域。视觉显著性检测在计算机视觉应用中有着重要的作用,例如图像检索、图像/视频压缩、视频监控等,它可以减少对感兴趣的区域进一步操作处理。静态图像显著性检测是一个很热门的研究课题,但是视频场景中比静态图像包含更多的信息,这个额外的时间信息是人类知觉的一个重要方面。因此,为了获得动态场景的时空显著性图有必要增加运动信息。视频连续帧之间有着强烈的时空相关性。由于增加了时间上的信息,视频在感知和处理上比起静态图像更加复杂。一种常见处理视频序列方法是分别计算静态显著性图和动态显著图,再利用一个线性或非线性的方案并将其进行融合得到最后的时空显著图。这种显著性模型的准确性取决于静态和动态显著图的质量以及融合方法。这种方式简单地把视频图像的静态特征和运动特征分开处理,没有考虑到视频是一个整体的结构。一般来说运动的物体比较吸引人的目光,所以在视频中,运动信息起到重要作用。静态特征和运动特征都对显著目标有贡献,基于这种考虑,本文将静态和动态特征结合一起,提出了一种基于时空梯度的视频显著性检测方法。提出的方法包括以下步骤:首先,对输入的视频图像帧进行颜色空间转换提取颜色特征,利用光流法提取运动特征,然后利用FCM算法在各个特征通道上进行聚类,得到聚类区域;接着,计算视频图像帧的颜色梯度和光流运动梯度,结合颜色梯度和光流运动梯度得到时空梯度图;利用每个特征通道上聚类区域和得到的时空梯度图计算每个聚类区域的时空梯度值,自适应的的阈值选取方案被提出来进行候选显著性区域和背景区域的划分,并选取候选显著区域中时空梯度值最大的区域作为关注焦点;然后,提出了一个从候选显著区域提取完整显著区域的融合过程,根据关注焦点,候选的显著性区域以及背景区域之间的特征差异,进行显著区域融合,得到轮廓和形状更为完整的显著区域;最后,利用显著性目标区域和背景区域之间的颜色特征差异来度量图像的显著性值,最后采用一个高斯滤波做进一步优化,得到最终的显著性图。本文提出的方法在公开的视频数据集上进行实验测试,实验结果表明,本文提出的方法比现有的一些算法表现出更好的性能。