论文部分内容阅读
[摘要]随着科学技术的发展以及人们对安全防范意识的不断增强,具有智能分析功能的新一代视频监控系统将成下一代视频监控技术发展的趋势。其中,运动目标检测技术对是智能视频分析技术的基本前提。因此,针对智能视频分析技术的需求,研究运动目标检测算法是一个重要课题。本文分析了运动目标检测算法的国内外相关研究现状,综述了基本概念,主要技术,发展状况及趋势。
[关键词]视频监控;智能视频分析;运动目标检测;
[中图分类号]TP391.4 [文献标识码]A [文章编号]1672-5158(2013)06-0203-01
1 引言
随着科学技术的发展以及人们对安全防范意识的不断增强,具有智能分析功能的新一代视频监控系统,已经开始渗入到我们的日常生活当中。
智能视频监控是指在不需要人为干预的情况下,利用计算机视觉分析方法对视频序列进行自动分析,实现运动目标检测、分类、识别、跟踪等,并在此基础上,通过预先设定的规则对目标的行为进行分析,从而为采取进一步措施提供参考(比如在对象进入设防区时自动报警)。其中,运动检测的目的是通过对监控视频图像序列的分析,确定监控场景中有无运动目标,进而把运动区域(也称前景区域)从检测图像中提取出来。在智能视频监控中扮演着重要的角色,是后续目标跟踪和运动分析的基础。
2 运动目标检测算法发展状况
国外对运动目标检测的理论及应用的研究较早,尤其在1996年至1999年间美国国防高级研究项目署的视频监控重大项目VSAM(Videosurveillance and Monitoring)。主要目标是通过视频理解、传感器融合、网络通信技术实现对未来战场、城市、机场等进行自动监控。
在国内,中国科学院自动化研究所里的生物识别与安全技术研究中心CBSR(Center for Biometrics and Security Research)研究开发有行人与车辆的多目标检测、跟踪以及分类、目标异常行为的识别与报警等智能分析技术,并实现一个动态场景集成、分析和演示系统,并最终推向实用。
3 现有的运动目标检测算法
根据序列图像的背景情况,运动目标检测算法可以分为静态背景下运动目标检测算法和动态背景下运动目标检测算法。静态背景是指摄像机在整个监视过程是静止的,而动态背景是指在监视过程中摄像机发生了移动,如平动、旋转或多自由度运动。动态背景下的运动目标检测由于目标与摄像机之间存在着复杂的相对运动,所以检测算法要比静态背景下的检测算法复杂的多。目前,—般的视频监控系统都是采用固定摄像头的方式,因此这里主要是研究静态背景下的运动目标检测算法。
运动目标检测方法主要有以下几种:帧间差分法、背景差分法、光流法以及混合高斯模型法。这些方法基于的原理不同,且各有优劣,以下详细介绍这几种方法。
3.1 帧间差分法
帧间差分法是一种基于像素的运动检测方法,它通过对视频图像序列中相邻两帧或相邻几帧图像进行差分运算来获得运动物体轮廓。
该法是运动目标检测方法最简单的一种,具有较低的时间复杂度以及运算简单等特点,可用于实时检测的系统。但是,这种算法存在一些局限性:(1)检测的运动目标区域大小与目标的运动速度有直接关系。当物体运动缓慢时,相邻两帧间的目标移动的距离小,检测的区域和实体相差也小,但如果速度慢到一定程度就会检测不到;当运动目标的速度很大时,检测的区域相应的会变大,从而造成检测的运动目标准确性偏低。(2)提取的运动区域会产生“空洞”现象。
3.2 背景差分法
背景差分法是通过对给定的视频序列图像进行学习,使用特定的数学模型来对图像中场景的背景进行建模并存储起来,然后用当前的视频序列图像与存储的背景模型做差分并通过选定适当的阈值来二值化,最终就得到相应的运动区域。该法在场景比较简单时,使用简单的背景模型可得到很好的检测效果,但在复杂多变的场景,就会出现过多的漏检现象。
因此,该方法仍需解决以下问题:(1)如何获取理想的背景模型以及建立理想的背景模型;(2)如何保持与更新背景。但是在环境比较复杂的情况下,背景都会随着时间的推移、外界光线变化以及现场环境的变化而发生改变,该法还是不能准确完整地提取运动目标。
3.3 光流法
光流是指图像中灰度模式的运动速度,它是图像中景物的三维速度矢量在成像平面上的投影,它表示了景物在图像中位置的瞬时变化,而光流场是运动场在二维图像上的投影,该物理量包含了有关运动和结构的重要信息。一般情况下,可以通过物体的运动场研究物体的运动,把光流看作运动场,通过研究光流场来估计图像序列的运动情况。
光流法的优点是检测精度较高,适合做精确分析,可以获得目标的运动参数等信息,也可以解决传统的基于特征的运动目标检测难以解决的遮挡,重合等问题。但实际应用中,存在运算量大、件要求较、对噪声非常敏感等问题。
3.4 混合高斯模型法
Grimson等人首先提出了基于混合高斯模型的背景建模算法,它的基本思想是:每一个像素的颜色值用个单高斯分布描述,的选取依赖于像素值的分布情况,通常值取3~5。由于彩色图像颜色通道之间相关性很小,可以忽略各通道间的之间相关性,假定了三个通道相互独立,且具有相同的方差,因此只需对均值、方差和协方差三个参数进行初始化、计算、更新,即可实现混合高斯模型的背景建模。
因此,该算法具有鲁棒性强,受外界条件变化的影响较小,能够适应复杂环境下运动目标检测,不仅克服了帧间差分法容易出现遗漏的缺点,也很好地解决背景差分法对光照等外部条件造成的动态场景变化过于敏感的问题,能够对运动目标进行快速准确的定位。由于混合高斯模型有其自身的优点,所以得到广泛学者的研究。
结论与展望
本文对智能视频监控中的运动目标检测算法进行了分析,其中混合高斯模型在运动目标检测算法中实际应用较广泛,但也存在一些问题,如计算量大且比较复杂,处理时间比较长,同时还存在背景和前景的相互转化时长时间的“影子”滞留、运动目标移动出现拖影等。针对这些问题,可以从采用隔帧更新策略或对背景更新率与权值相关联,使更新率自适应改变来进一步研究,解决现有混合高斯模型中存在的不足,最终找到一种既快速又准确的运动目标检测算法。
[关键词]视频监控;智能视频分析;运动目标检测;
[中图分类号]TP391.4 [文献标识码]A [文章编号]1672-5158(2013)06-0203-01
1 引言
随着科学技术的发展以及人们对安全防范意识的不断增强,具有智能分析功能的新一代视频监控系统,已经开始渗入到我们的日常生活当中。
智能视频监控是指在不需要人为干预的情况下,利用计算机视觉分析方法对视频序列进行自动分析,实现运动目标检测、分类、识别、跟踪等,并在此基础上,通过预先设定的规则对目标的行为进行分析,从而为采取进一步措施提供参考(比如在对象进入设防区时自动报警)。其中,运动检测的目的是通过对监控视频图像序列的分析,确定监控场景中有无运动目标,进而把运动区域(也称前景区域)从检测图像中提取出来。在智能视频监控中扮演着重要的角色,是后续目标跟踪和运动分析的基础。
2 运动目标检测算法发展状况
国外对运动目标检测的理论及应用的研究较早,尤其在1996年至1999年间美国国防高级研究项目署的视频监控重大项目VSAM(Videosurveillance and Monitoring)。主要目标是通过视频理解、传感器融合、网络通信技术实现对未来战场、城市、机场等进行自动监控。
在国内,中国科学院自动化研究所里的生物识别与安全技术研究中心CBSR(Center for Biometrics and Security Research)研究开发有行人与车辆的多目标检测、跟踪以及分类、目标异常行为的识别与报警等智能分析技术,并实现一个动态场景集成、分析和演示系统,并最终推向实用。
3 现有的运动目标检测算法
根据序列图像的背景情况,运动目标检测算法可以分为静态背景下运动目标检测算法和动态背景下运动目标检测算法。静态背景是指摄像机在整个监视过程是静止的,而动态背景是指在监视过程中摄像机发生了移动,如平动、旋转或多自由度运动。动态背景下的运动目标检测由于目标与摄像机之间存在着复杂的相对运动,所以检测算法要比静态背景下的检测算法复杂的多。目前,—般的视频监控系统都是采用固定摄像头的方式,因此这里主要是研究静态背景下的运动目标检测算法。
运动目标检测方法主要有以下几种:帧间差分法、背景差分法、光流法以及混合高斯模型法。这些方法基于的原理不同,且各有优劣,以下详细介绍这几种方法。
3.1 帧间差分法
帧间差分法是一种基于像素的运动检测方法,它通过对视频图像序列中相邻两帧或相邻几帧图像进行差分运算来获得运动物体轮廓。
该法是运动目标检测方法最简单的一种,具有较低的时间复杂度以及运算简单等特点,可用于实时检测的系统。但是,这种算法存在一些局限性:(1)检测的运动目标区域大小与目标的运动速度有直接关系。当物体运动缓慢时,相邻两帧间的目标移动的距离小,检测的区域和实体相差也小,但如果速度慢到一定程度就会检测不到;当运动目标的速度很大时,检测的区域相应的会变大,从而造成检测的运动目标准确性偏低。(2)提取的运动区域会产生“空洞”现象。
3.2 背景差分法
背景差分法是通过对给定的视频序列图像进行学习,使用特定的数学模型来对图像中场景的背景进行建模并存储起来,然后用当前的视频序列图像与存储的背景模型做差分并通过选定适当的阈值来二值化,最终就得到相应的运动区域。该法在场景比较简单时,使用简单的背景模型可得到很好的检测效果,但在复杂多变的场景,就会出现过多的漏检现象。
因此,该方法仍需解决以下问题:(1)如何获取理想的背景模型以及建立理想的背景模型;(2)如何保持与更新背景。但是在环境比较复杂的情况下,背景都会随着时间的推移、外界光线变化以及现场环境的变化而发生改变,该法还是不能准确完整地提取运动目标。
3.3 光流法
光流是指图像中灰度模式的运动速度,它是图像中景物的三维速度矢量在成像平面上的投影,它表示了景物在图像中位置的瞬时变化,而光流场是运动场在二维图像上的投影,该物理量包含了有关运动和结构的重要信息。一般情况下,可以通过物体的运动场研究物体的运动,把光流看作运动场,通过研究光流场来估计图像序列的运动情况。
光流法的优点是检测精度较高,适合做精确分析,可以获得目标的运动参数等信息,也可以解决传统的基于特征的运动目标检测难以解决的遮挡,重合等问题。但实际应用中,存在运算量大、件要求较、对噪声非常敏感等问题。
3.4 混合高斯模型法
Grimson等人首先提出了基于混合高斯模型的背景建模算法,它的基本思想是:每一个像素的颜色值用个单高斯分布描述,的选取依赖于像素值的分布情况,通常值取3~5。由于彩色图像颜色通道之间相关性很小,可以忽略各通道间的之间相关性,假定了三个通道相互独立,且具有相同的方差,因此只需对均值、方差和协方差三个参数进行初始化、计算、更新,即可实现混合高斯模型的背景建模。
因此,该算法具有鲁棒性强,受外界条件变化的影响较小,能够适应复杂环境下运动目标检测,不仅克服了帧间差分法容易出现遗漏的缺点,也很好地解决背景差分法对光照等外部条件造成的动态场景变化过于敏感的问题,能够对运动目标进行快速准确的定位。由于混合高斯模型有其自身的优点,所以得到广泛学者的研究。
结论与展望
本文对智能视频监控中的运动目标检测算法进行了分析,其中混合高斯模型在运动目标检测算法中实际应用较广泛,但也存在一些问题,如计算量大且比较复杂,处理时间比较长,同时还存在背景和前景的相互转化时长时间的“影子”滞留、运动目标移动出现拖影等。针对这些问题,可以从采用隔帧更新策略或对背景更新率与权值相关联,使更新率自适应改变来进一步研究,解决现有混合高斯模型中存在的不足,最终找到一种既快速又准确的运动目标检测算法。