视频图像运动目标分割研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:yangjian1235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频图像中的运动目标分割技术是计算机视觉中的一个重要研究方向,是许多视频处理技术的基础。运动对象分割技术具有广泛的应用前景,如视频监控、视频编码、视频检索、多媒体创作、图像理解、模式识别等。对象分割技术的目的是在时间轴上将视频图像分割成一系列相互关联的空间区域。这种基于区域的图像表示方法为视频的灵活处理提供了可能。   本文重点研究在摄像机运动情况下的运动目标分割方法。在全局运动估计方面,提出一个三参数全局运动模型来建模摄像机运动,并依靠递归最小二乘估计法ILSE(Iterative Least Square Estimation)来计算运动模型的3个参数。在对象分割方面,提出一种基于“图切割”(Graphcuts)技术的运动目标精确分割算法,该方法还可以通过不同的运动层次表征图像中不同的运动情况。此外,本文还研究了立体视觉在运动目标分割中的应用。针对立体视觉中的全局运动问题,提出了一个6参数立体全局运动模型SGMM(Stereo Global Motion Model)来建模摄像机运动。SGMM被应用在汽车导航系统中来对道路视频中的运动目标进行检测和分割。具体的研究内容如下:   一、在全局运动估计方面,提出了一种基于三参数模型的快速全局运动估计算法,主要贡献可以概括为三点:一、提出了新的三参数模型建模全局运动,在保证准确性的同时用更少的参数来描述和估计全局运动;二、提出了基于梯度信息的宏块预判方法,在光流场计算之前提前剔除可能产生错误估计的宏块,通过减少参与光流计算的宏块数目降低参数估计的运算量:三、将梯度信息引入光流场计算中,提出了快速光流场计算算法。   二、提出了一种基于“图切割”(Graphcuts)的运动目标精确分割算法:该方法通过定义新的能量函数,使得到的运动层具有更好的连贯性和准确性。此外,为了使检测到的运动目标边缘更加准确,将运动分层结果与静态图像分割结果结合。利用水线法获得图像的静态分割,并通过“水线崩溃”算法进行区域合并改进分割效果,将其与运动分层得到的初始“目标区域”结合,在分割运动目标时得到更加准确的边缘。   三、面向立体视觉在运动目标分割中的应用,提出了一种6参数的立体全局运动模型SGMM(Stereo global motion model)。该模型能够直接利用灰度图像和视差图像的运动变化,估计由摄像机引起的全局运动。基于这一立体全局运动模型,无需知道摄像机的实际运动,就可以快速的区分图像中的全局运动与局部运动,从而为实时的运动目标检测提供了可能。   四、利用立体视觉及SGMM解决交通场景中的运动目标检测问题。首先,通过角点跟踪方法获得连续图像帧之间的运动对应点,根据对应点采用递归最小二乘法估计SGMM的运动参数,由此获得了视频图像中的全局运动信息。然后,通过基于立体坐标系的三维场景分析,将交通场景的图像根据三维特征分割为若干“目标区域”。综合得到的“目标区域”以及全局运动信息,通过将“目标区域”的运动与基于SGMM的全局运动相比较,检测出运动目标。实验结果展现了令人满意的分割效果。
其他文献
学位
本课题主要针对基于粗糙集的故障诊断专家系统进行了研究、改进与开发,并将其应用于DCS故障诊断中。首先,综合分析了当前国内外故障诊断理论和技术的研究现状。其次,根据粗糙集
脑电图(EEG)为研究者提供了一种揭示人类大脑奥秘的途径。最近二十年脑认知科学得到了迅速的发展,尤其是在生物医学领域,EEG作为一种分析依据发挥着越来越重要的作用。但是,由于
机器翻译作为替代传统高成本的人工翻译的可行方案,具有很高的应用价值。然而,传统的统计机器翻译模型因其线性不可分、全局信息丢失严重、语义无关、错误传播等问题面临严峻的
支持向量机在学习模型中运用了统计学习中的VC维理论和结构风险化原则,具有很好的泛化性能,在小样本学习问题上表现突出。本文对支持向量机在数据挖掘领域的应用展开深入研究,涉
本工作针对《CNG单燃料燃气发动机燃料供给电控系统研究》项目(CNG—CompressedNaturalGas,即压缩天然气)完成了电控压力调节系统的设计和部分调试。 出于环保和能源方面考
随着现代工业及科学技术的迅速发展,故障诊断已经越来越受到重视。近年来,不少研究者将主元分析应用于故障诊断中,取得了不错的效果。本文正是基于主元分析和故障诊断的基础上,进
本文介绍了遗传算法的基本原理和特点,并针对传统遗传算法存在的不足,提出了一种采用“适应度值缩放+最优个体保护策略+使用多种交叉函数”的改进型遗传算法。该改进型遗传算法
针对化工过程故障诊断问题的特点,提出了一种新型的基于小波降噪、遗传算法和模糊神经网络的复合智能网络算法(简称WLT-GA-FNN网络)。WLT-GA-FNN算法首先应用小波分析方法对化
目标探测(TargetDetection)也称目标检测,就是找出图像中潜伏目标存在区域的位置。目标探测是自动目标识别(AutomaticTargetRecognition,ATR)系统中重要的环节。自动目标识别