论文部分内容阅读
近年来,运动和视频计算已成为计算机视觉领域里的一个新研究热点。除了传统的基于视频序列的视觉运动分析,如二维运动的光流计算,三维运动和形状的结构化,视频序列中的运动信息还被广泛用于解决视频合成、视频分割、视频压缩、视频配准和视频监控和监视等问题。视频数据除了具有与图像一样的空间特性外(如颜色、边缘和纹理等),还具有时序特性,即视频中存在运动信息。因此,与传统的图像分析技术相比,基于视频的运动信息分析在上述领域中能够起到更加重要的作用。然而在实际应用中,因摄像机运动造成的背景运动、摄像机抖动、前景物体的不规则运动等因素都给视频中的运动信息分析带来了极大的困难。本论文针对这些问题对视频运动信息分析技术进行了较深入的研究,取得了以下成果:1.快速准确的全局运动估计全局运动估计是指对视频序列中造成背景运动的摄像机运动进行估计。通过全局运动估计,可获得帧间的像素相关性,从而将复杂运动背景下的运动分析转化为静态背景下的运动分析。全局运动估计是对具有动态背景的视频进行运动信息分析的基础。本论文提出了一种自适应外点过滤算法,并使用该算法对MPEG-4校验模型所采用的Konrad全局运动估计方法进行了改进。改进方法通过交替的全局运动参数估计和自适应的外点过滤,有效地抑制外点的影响,实现准确的全局运动估计。与Konrad方法相比,本文方法在保证估计精度的同时,全局运动估计速度提高1倍左右。2.抖动视频的高质量稳定化视频稳定化是指去除视频中因不必要的的摄像机运动而造成的视觉抖动,以提高视频的视觉质量。视频中的抖动不仅会造成视觉质量的下降,更会给后继的分析处理造成困难,因此需要对抖动视频进行稳定化处理。针对视频中的抖动,本论文提出了一种基于多轨迹映射的稳定化算法。该算法将估计出的摄像机运动映射成多条运动轨迹,并对这些轨迹曲线进行平滑,从而去除摄像机的抖动。然后根据平滑前后的摄像机运动参数重构视频中的各帧图像,最终获得高质量的稳定化视频。与现有算法相比,该算法大大减少了需要用户调节的稳定化参数,同时稳定化后的视频具有更佳的视觉质量。3.动态场景视频中运动对象的自动检测与准确分割视频运动对象分割是基于对象的视频编码、基于内容的视频检索和基于视觉的人体运动分析等应用的基础。本论文从对象检测(提取出包含运动对象的前景区域)和对象分割(提取出运动对象的精确轮廓)两个层次对具有动态场景的视频中的运动对象分割进行了研究。1)为了提取出前景区域,本文通过直方图拟合获得准确的背景噪声方差,并用显著性测试技术对时序帧差进行二值化,从而有效地消除帧间的重叠背景并提取出前景区域,克服了以往只能依据经验设定背景噪声方差的缺点。2)为了提取出运动对象的精确轮廓,本文提出了一种基于动态背景构造的对象分割算法。该算法先将动态构造的背景从图像中消除,并参考时序信息准确地将运动对象