论文部分内容阅读
运动检测作为视频监控的一个基础,经过几十年的发展,主要有三种方法,即帧间差分法、背景减除法和光流法。帧间差分法法适用于背景动态变化的场景,其缺点往往只能提取部分的运动物体,并不能检测完整的运动区域。背景减除虽然能够得到完整的运动区域,但是其往往容易受到光照变化、复杂的运动对象(树叶等)而产生误检测,往往需要对该算法的背景模型进行改进,如单高斯模型、混合高斯模型、隐马尔科夫模型等。光流法能够很好的检测运动对象,但是其计算复杂性往往比前两者更高,不适用于计算性能有限的平台。H.264视频编码标准是几十年提出来的编码标准,在各行各业已经得到广泛应用,与之前的编码标准相比有很多的优点,其中用运动矢量表示宏块在前后帧的运动方向,虽然不能完全反应物体的运动。但是这为视频运动检测提供了方便,而运动检测是视频监控的基础。图像处理中,描述二维形状的方法很多,例如简单标量(欧拉数、伸长度、凹凸性等),另外还有常用的矩不变量、Shape Context等。本文使用矩不变量描述形状,其计算过程相对于Shape Context简单,但是不如Shape Context更能描述形状之间的相似性。马尔科夫随机场(MRF)以条件概率的形式来描述图像数据,Hammersley和Clifford于1971年证明了MRF和Gibbs分布的等价性。目前MRF已经得到广泛应用,特别是其在图像分割方面的应用。本文主要面向H.264编码的视频进行运动检测。首先从视频码流中获取运动矢量,将获得的运动矢量建立MRF运动分割模型,求解该模型时,本文采用聚类分析来优化标准的ICM算法。求解模型的得到运动目标。得到运动目标之后,使用矩不变量作为形状描述符,配合KNN最近邻规则来实现运动目标的判断,是否为要检测的目标。最后的实验表明,本文的算法相对于背景减除法、帧间差分法、光流法等像素级别的运动检测方法时间复杂度较低,由于采用了KNN算法来消除或者降低矩不变量的误差,能够满足高清视频监控的实时性。