论文部分内容阅读
随着采集设备的普及和互联网技术的飞速发展,视频已成为人们日常生活中不可或缺的信息表现方式和沟通交流的载体。但对于计算机而言,视频数据本身并不显式地包含物体占据的区域、物体间的空间位置关系和物体的受关注度等。计算机很难像人一样从内容和语义层面理解视频的内容。视觉显著性以人类视觉系统感知和处理信息的方式分析视频的内容,进而检测出视频中的显著区域,然后进一步根据视觉显著性的检测结果,区别对待不同显著程度的区域,从而达到分析视频数据的目的。如何模拟人类视觉系统复杂的生理构造,特别是其快速筛选感兴趣目标的能力,实现视觉显著区域的自动检测和识别,已成为计算机视觉、计算机图形学和多媒体技术等的研究热点。 不同的视觉显著性检测算法由于衡量视觉特征差异的方式不同,显著性检测结果相差很大。如何根据视觉原理检测出满足实际应用需求的视频显著区域值得深入研究。本文首先阐述了视频显著性检测的研究意义,分析了该领域的研究现状,介绍了视觉注意生物机理和视觉注意建模的理论基础,接下来对视频显著性检测的已有成果进行了总结,最后提出一种基于时空显著性的视频显著区域检测算法,该算法利用自底向上的视觉注意方式,根据视频自身的内容计算出能较好的保持物体的形状特征和轮廓特征的时空显著图,更加符合实际应用的需求。具体包括以下三个部分:第一部分是空间显著区域检测算法,用于提取图像中的显著区域,该算法以图像中的亮度和颜色为特征,分别计算局部显著性和全局显著性,然后通过显著性度量算法选择一个较好的显著图,再进行位置先验性考虑,最后得到最终的空间显著图;第二部分是时间显著区域检测算法,用于提取具有特殊运动特征的区域,该算法首先利用光流法提取连续两帧中的运动信息,然后判断是否存在全局运动,当存在全局运动时,用Meanshift算法计算出背景运动矢量,最后根据运动信息和背景运动的差异计算出时间显著图;第三部分是时间显著图和空间显著图融合的方法,用于得到最后的时空显著图。 本文提出的基于时空显著性的视频显著区域检测算法综合考虑了空间上和时间上的显著性影响因素,生成的全分辨率时空显著图能均匀突出显著物体,更加符合实际应用需求,并在公开数据集上进行了实验,验证了它的可行性。