论文部分内容阅读
视频图像中的运动目标分割技术是计算机视觉中的一个重要研究方向,是许多视频处理技术的基础。运动对象分割技术具有广泛的应用前景,如视频监控、视频编码、视频检索、多媒体创作、图像理解、模式识别等。对象分割技术的目的是在时间轴上将视频图像分割成一系列相互关联的空间区域。这种基于区域的图像表示方法为视频的灵活处理提供了可能。
本文重点研究在摄像机运动情况下的运动目标分割方法。在全局运动估计方面,提出一个三参数全局运动模型来建模摄像机运动,并依靠递归最小二乘估计法ILSE(Iterative Least Square Estimation)来计算运动模型的3个参数。在对象分割方面,提出一种基于“图切割”(Graphcuts)技术的运动目标精确分割算法,该方法还可以通过不同的运动层次表征图像中不同的运动情况。此外,本文还研究了立体视觉在运动目标分割中的应用。针对立体视觉中的全局运动问题,提出了一个6参数立体全局运动模型SGMM(Stereo Global Motion Model)来建模摄像机运动。SGMM被应用在汽车导航系统中来对道路视频中的运动目标进行检测和分割。具体的研究内容如下:
一、在全局运动估计方面,提出了一种基于三参数模型的快速全局运动估计算法,主要贡献可以概括为三点:一、提出了新的三参数模型建模全局运动,在保证准确性的同时用更少的参数来描述和估计全局运动;二、提出了基于梯度信息的宏块预判方法,在光流场计算之前提前剔除可能产生错误估计的宏块,通过减少参与光流计算的宏块数目降低参数估计的运算量:三、将梯度信息引入光流场计算中,提出了快速光流场计算算法。
二、提出了一种基于“图切割”(Graphcuts)的运动目标精确分割算法:该方法通过定义新的能量函数,使得到的运动层具有更好的连贯性和准确性。此外,为了使检测到的运动目标边缘更加准确,将运动分层结果与静态图像分割结果结合。利用水线法获得图像的静态分割,并通过“水线崩溃”算法进行区域合并改进分割效果,将其与运动分层得到的初始“目标区域”结合,在分割运动目标时得到更加准确的边缘。
三、面向立体视觉在运动目标分割中的应用,提出了一种6参数的立体全局运动模型SGMM(Stereo global motion model)。该模型能够直接利用灰度图像和视差图像的运动变化,估计由摄像机引起的全局运动。基于这一立体全局运动模型,无需知道摄像机的实际运动,就可以快速的区分图像中的全局运动与局部运动,从而为实时的运动目标检测提供了可能。
四、利用立体视觉及SGMM解决交通场景中的运动目标检测问题。首先,通过角点跟踪方法获得连续图像帧之间的运动对应点,根据对应点采用递归最小二乘法估计SGMM的运动参数,由此获得了视频图像中的全局运动信息。然后,通过基于立体坐标系的三维场景分析,将交通场景的图像根据三维特征分割为若干“目标区域”。综合得到的“目标区域”以及全局运动信息,通过将“目标区域”的运动与基于SGMM的全局运动相比较,检测出运动目标。实验结果展现了令人满意的分割效果。