论文部分内容阅读
数字视频序列中运动目标检测的目的是,把作为一个整体的视频图像序列,通过一定的方法分割出具有意义的运动对象实体。运动目标检测在很多领域中有着重要的作用。例如,在计算机视觉中,运动体分割是对象识别的首要步骤,在图像压缩编码中,可以通过视频分割提高压缩的效率。近年来,由于MPEG2,MPEG4的发展提出了基于内容的编码方法,要实现对不同内容进行不同编码,首先需要将视频序列通过对不同对象的检测,分割成有一定语义的区域。这些年来,图像和视频分割技术作为一个研究热点,国内外的专家学者也提出了很多有效的分割算法,但是由于视频图像本身内容复杂,加上受到噪声的影响,并且视频图像各有特点,目前还不存在一种通用的、对各类视频都有效的解决方案。本论文设计了一种基于码书的视频运动目标检测算法。对于视频序列的每个像素点,分别提取出特征参数组成为一个码矢量。码矢量给出了每个像素点在该段视频中的变化特性分布。因为一个码久量对应于一个模型,所以一个像素点的码书足以全面描述该段视频中的像素变化。对一段属于同一个镜头的视频图像序列,相同位置处的像素点存在一定的相关性,因此每个像素点对应的码矢量可以通过背景模型的一种聚类准则来进行聚类,在聚类得到的每个像素点的码书中,码矢量的个数都是不相同的,所以对背景的模型描述更加灵活、丰富,所得到的背景码书中既包括长期不变的固定背景,也有一些类周期运动的动态背景存在。本文的方法可以处理的场景包括背景运动或背景光线在发生变化的情况,对压缩后的视频也可以进行准确的检测,同时也解决了长时间视频序列中存在类周期运动的问题(如树叶的晃动),本文算法提高了运动目标的检测质量,且适用的场景范围广泛。