论文部分内容阅读
摘 要:在本文中,我们比较了各种背景建模算法在城市交通视频序列中,对于检测运动车辆和行人的影响。我们考虑了不同的方法,从简单的技术,如帧差分和中值滤波到更多复杂的概率建模技术。说明各种算法在不同情况下性能优劣。
关键词:运动目标检测,帧差法,中值滤波法,混合高斯分布法
目前背景提取的算法很多,有基于时间轴的滤波方法,如中值滤波;有基于统计模型的方法,如混合高斯分布模型。虽然方法很多,但是很难找到一种在各种情况下都表现最好的算法。本文主要比较帧差法,中值滤波,混合高斯滤波在不同情况下的性能优劣。
1 帧差法
帧差法是最为常用的运动目标检测和分割方法之一,基本原理就是利用基于时间序列图像中相邻两帧或者几帧图像逐个像素进行对比得到一副差值图像,然后通过事先确定的阈值对差值图像进行二值化处理。在环境亮度变化不大的情况下,如果对应像素值变化小于事先确定的阈值时,可以认为此处为背景像素如果图像区域的像素值变化很大,可以认为这是由于图像中运动物体引起的,将这些区域标记为前景像素,利用标记的像素区域可以确定运动目标在图像中的位置。
简单的两帧差对噪声有一定的敏感性,而且对象运动的速度不能太快,否则由于背景被运动物体的遮挡和重现使得计算出的运动区域的掩模要大于运动物体的尺寸。两帧间运动物体的位移越大,这种差距就越大。由于相邻两帧间的时间间隔非常短,用前一帧图像作为当前帧的背景模型具有较好的实时性,其背景不积累,且更新速度快、算法简单、计算量小。
2中值滤波
选择像素灰度,通过包含运动目标的序列帧提取初始背景。对视频中的任意一个像素点,只有在前景运动目标通过该点时,它的灰度值才会发生明显变化,其余大部分时间处,该点的灰度值是基本保持不变的,总是在一个区域内波动,因此可以用这个区域内的中值作为该点的背景值。
若有L帧视频图像,只有当L帧图像内有一半以上是背景的灰度值,目标灰度和噪声很少的情况下,该算法才具有可行性。在该算法中,L的选择很关键,如果取值过大,算法的运算时间较长,若小,检测运动缓慢的目标时将会产生漏检,甚至出现空洞现象。
3混合高斯
建立背景模型,假定初始背景中不含运动目标。其基本思想是:对于每个像素,定义K(基本为3~5个,K值越大处理波动的能力越强)个高斯模型来表征图像中各个像素点的特征,在新一帧图像获得后更新混合高斯模型。用当前图像中的每个像素点与混合高斯模型匹配,如果成功则判定该点为背景点.否则为前景点。若每个像素点颜色取值用变量 表示,其概率密度函数为:
4 实验结果与分析
本文所用仿真软件是MATLAB2012b,图4.1研究了将彩色图像转换成灰度图像,然后通过帧差法进行背景建模。算法的不足在于对环境噪声较为敏感,对于比较大的、颜色一致的运动目标,有可能在目标内部产生空洞,无法完整地提取运动目标。帧间差分法只能应用在摄像机静止情况下的动态目标检测。
图4.1 视频traffic1中的第九帧 (帧差法)
图4.2研究了将彩色图像转换成灰度图像,然后通过灰度值的中值来进行背景建模。总体来说中值法的效果比帧差法的效果理想。该算法存在的问题在于:图像帧的像素点大多以数万,数十万的数量级出现,而用于取中值的图像帧数量L也应该比较大。对如此大的数组进行排序取出中值,实现时计算量较大,处理较慢。同时需要占用大量的内存单元用于存储数据。
图4.2 视频traffic1中的第九帧(中值法)
图4.3利用混合高斯法进行背景建模。混合高斯适应背景随时间的缓慢变化,能描述背景中的一些较大的周期性扰动,能适应背景内容的变化。但是无法精确提取缓慢运动的目标,不能适应背景的突然变化,存在噪声,阴影时容易导致误检或者漏检的现象。混合高斯更适应于外部环境比较复杂的情况。
图4.3 视频traffic1中的第九帧(混合高斯法)
5 结束语
通过实验发现,帧差法和中值滤波法适合特定的场合,即外部扰动比较小的情况,混合高斯法在外部环境变化较大的情况下效果更好。
参考文献:
[1] R. Cucchiara, M. Piccardi, and A. Prati, "Detecting moving objects, ghosts, and shadows in video streams," IEEE Transactions on Pattern Analysis and Machine Intelligence 25, pp. 1337-1342, Oct 2003.
[2] B. Lo and S. Velastin, "Automatic congestion detection system for underground platforms," in Proceedings of 2001 International symposium on intelligent multimedia, video, and speech processing, pp. 158-161, (Hong Kong), May2001.
[3] Q. Zhou and J. Aggarwal, "Tracking and classifying moving objects from videos," in Proceedings of IEEE Workshop on Performance Evaluation of Tracking and Surveillance, 2001.
[4]Sen-Ching S. Cheung and Chandrika Kamath," Robust techniques for background subtraction in urban traffic video," in Proceedings of the SPIE 5308, Visual Communications and Image Processing 2004.
作者簡介:郭茹侠( 1990.5.27-) 陕西省西安市人, 长安大学硕士研究生;李日财(1990.4. 25-)男,辽宁省大连市人, 西安邮电大学硕士研究生。
关键词:运动目标检测,帧差法,中值滤波法,混合高斯分布法
目前背景提取的算法很多,有基于时间轴的滤波方法,如中值滤波;有基于统计模型的方法,如混合高斯分布模型。虽然方法很多,但是很难找到一种在各种情况下都表现最好的算法。本文主要比较帧差法,中值滤波,混合高斯滤波在不同情况下的性能优劣。
1 帧差法
帧差法是最为常用的运动目标检测和分割方法之一,基本原理就是利用基于时间序列图像中相邻两帧或者几帧图像逐个像素进行对比得到一副差值图像,然后通过事先确定的阈值对差值图像进行二值化处理。在环境亮度变化不大的情况下,如果对应像素值变化小于事先确定的阈值时,可以认为此处为背景像素如果图像区域的像素值变化很大,可以认为这是由于图像中运动物体引起的,将这些区域标记为前景像素,利用标记的像素区域可以确定运动目标在图像中的位置。
简单的两帧差对噪声有一定的敏感性,而且对象运动的速度不能太快,否则由于背景被运动物体的遮挡和重现使得计算出的运动区域的掩模要大于运动物体的尺寸。两帧间运动物体的位移越大,这种差距就越大。由于相邻两帧间的时间间隔非常短,用前一帧图像作为当前帧的背景模型具有较好的实时性,其背景不积累,且更新速度快、算法简单、计算量小。
2中值滤波
选择像素灰度,通过包含运动目标的序列帧提取初始背景。对视频中的任意一个像素点,只有在前景运动目标通过该点时,它的灰度值才会发生明显变化,其余大部分时间处,该点的灰度值是基本保持不变的,总是在一个区域内波动,因此可以用这个区域内的中值作为该点的背景值。
若有L帧视频图像,只有当L帧图像内有一半以上是背景的灰度值,目标灰度和噪声很少的情况下,该算法才具有可行性。在该算法中,L的选择很关键,如果取值过大,算法的运算时间较长,若小,检测运动缓慢的目标时将会产生漏检,甚至出现空洞现象。
3混合高斯
建立背景模型,假定初始背景中不含运动目标。其基本思想是:对于每个像素,定义K(基本为3~5个,K值越大处理波动的能力越强)个高斯模型来表征图像中各个像素点的特征,在新一帧图像获得后更新混合高斯模型。用当前图像中的每个像素点与混合高斯模型匹配,如果成功则判定该点为背景点.否则为前景点。若每个像素点颜色取值用变量 表示,其概率密度函数为:
4 实验结果与分析
本文所用仿真软件是MATLAB2012b,图4.1研究了将彩色图像转换成灰度图像,然后通过帧差法进行背景建模。算法的不足在于对环境噪声较为敏感,对于比较大的、颜色一致的运动目标,有可能在目标内部产生空洞,无法完整地提取运动目标。帧间差分法只能应用在摄像机静止情况下的动态目标检测。
图4.1 视频traffic1中的第九帧 (帧差法)
图4.2研究了将彩色图像转换成灰度图像,然后通过灰度值的中值来进行背景建模。总体来说中值法的效果比帧差法的效果理想。该算法存在的问题在于:图像帧的像素点大多以数万,数十万的数量级出现,而用于取中值的图像帧数量L也应该比较大。对如此大的数组进行排序取出中值,实现时计算量较大,处理较慢。同时需要占用大量的内存单元用于存储数据。
图4.2 视频traffic1中的第九帧(中值法)
图4.3利用混合高斯法进行背景建模。混合高斯适应背景随时间的缓慢变化,能描述背景中的一些较大的周期性扰动,能适应背景内容的变化。但是无法精确提取缓慢运动的目标,不能适应背景的突然变化,存在噪声,阴影时容易导致误检或者漏检的现象。混合高斯更适应于外部环境比较复杂的情况。
图4.3 视频traffic1中的第九帧(混合高斯法)
5 结束语
通过实验发现,帧差法和中值滤波法适合特定的场合,即外部扰动比较小的情况,混合高斯法在外部环境变化较大的情况下效果更好。
参考文献:
[1] R. Cucchiara, M. Piccardi, and A. Prati, "Detecting moving objects, ghosts, and shadows in video streams," IEEE Transactions on Pattern Analysis and Machine Intelligence 25, pp. 1337-1342, Oct 2003.
[2] B. Lo and S. Velastin, "Automatic congestion detection system for underground platforms," in Proceedings of 2001 International symposium on intelligent multimedia, video, and speech processing, pp. 158-161, (Hong Kong), May2001.
[3] Q. Zhou and J. Aggarwal, "Tracking and classifying moving objects from videos," in Proceedings of IEEE Workshop on Performance Evaluation of Tracking and Surveillance, 2001.
[4]Sen-Ching S. Cheung and Chandrika Kamath," Robust techniques for background subtraction in urban traffic video," in Proceedings of the SPIE 5308, Visual Communications and Image Processing 2004.
作者簡介:郭茹侠( 1990.5.27-) 陕西省西安市人, 长安大学硕士研究生;李日财(1990.4. 25-)男,辽宁省大连市人, 西安邮电大学硕士研究生。