论文部分内容阅读
MPEG-4最重要的特点是用音频-视频对象来描述内容和进行编码。这需要按照视频对象进行视频图像分割。这个问题本身非常复杂,到目前为止还没有一个很通用的成功方法。在MPEG-4标准中,视频对象的分割仍然是一个开放部分。作为MPEG-4最基本的出发点,视频分割算法的好坏对最终产品至关重要。正是基于这种考虑,本文选择了这一课题。 本文研究视频对象分割算法,侧重于高速算法和实时实现方法。本文方法的要点是利用视频对象运动的一致性。这要求对物体运动的估计精度足够高,计算速度足够快,为此本文提出了一种基于多分辨率分解的参数化运动估计算法。为了充分利用物体运动的相关性,需要利用物体的运动信息进行视频对象跟踪。 本文工作的贡献主要反映在以下三个部分。 1.在参数化运动的多分辨率估计中,首先对图像进行小波分解,然后从低分辨率到高分辨率逐级估计物体的运动。在每一分辨率下,利用最速下降法对初始运动估计进行调整。在最低分辨率下,利用光流场方法求出物体运动的初始估计。高分辨率下物体运动的初始估计是把低分辨率下的结果进行投影而得到的。为了减少模型失配对运动参数估计的影响,需要使用稳健估计方法。本文把M估计算子嵌入到多分辨率估计算法中,可以提高运动估计的精度。运动估计计算负担很重,为了适应实时处理的要求,硬件实现不可避免。本文给出了基于文中算法的一种硬件实现结构框图。 2.与通常所见到的视频对象分割算法不同,本文中的方法利用对象运动的一致性来分割视频对象。逐个估计图像中的运动,不同的运动对应着不同的支撑区域,不问的支撑区域对应着不同的视频对象。与通常方法相比,本算法的计算速度明显要快。 3.在进行视频对象的跟踪时,先利用运动信息投影视频对象,得到一个初始分割。再利用对象运动的一致性对边缘像素进行调整,就可以得到最后的分割结果。为了提高算法的效率,本文设计了一种正、逆光栅扫描方式的搜索方法。计算机模拟表明了本跟踪算法的有效性。 目前已报道的面向MPEG-4的视频对象分割算法都缺乏通用性,还有许多工作需要进行更深入的研究。算法的硬件实现是一个很富挑战性又必须解决的问题。这些问题也是本文作者将来的努力方向。