论文部分内容阅读
视频对象(Video Object, VO)的提取是视频信号处理领域研究的热点,在基于对象的视频编码、智能视频监控系统、人脸检测、目标识别、视频数据库检索等领域有着广泛的应用。由于现在的视频数据通常是以压缩的方式来存储和传输的,把这种压缩的数据还原到空间域上再提取对象难以实现实时操作,因此近年来运动对象提取的研究热点从像素域逐步过渡到了压缩域。在压缩域进行提取,可利用的信息有限且由于噪声的存在,导致提取的对象过于粗糙。本文研究的主旨就是解决上述从压缩域直接提取VO 的难题,使之既发挥从压缩域快速提取VO 的优势,又能逼近从像素域提取VO 的精度。
本文针对当今应用最广泛的MPEG-2 标准,研究压缩域进行运动对象提取的算法。主要工作如下:
第一,研究了在压缩域中进行全局运动估计与补偿的方法,利用背景区域的运动矢量和全局运动间的相似性和一致性,从背景区域的运动矢量场来估计全局运动,然后对运动矢量场进行补偿,得到前景物体的运动矢量。经全局运动估计与补偿,使后续的运动对象提取算法既适用于静止背景序列,也适用于动态背景序列。
第二,提出了一种压缩域基于时、空信息融合的运动对象提取算法。首先,在空域上重建I 帧的DC+2AC 低分辩率灰度图,用阈值分割方法来获取对象的轮廓特征,然后在时域上将P 帧的运动矢量置密,迭代投影于I 帧。融合空域和时域处理的信息,快速准确地实现了直接从压缩域中提取粗糙运动对象。再对粗糙的运动对象部分解码,在时间与精度间进行折中,以少许时间代价获得较高的精度,实验表明,该提取算法效果较好且具有实时性,可应用于实时分割系统。
第三,提出了一种压缩域中基于运动一致性模型的改进算法,先对可从MPEG码流中直接得到的运动矢量场进行可靠性度量校正、致密化和滤波处理,并采用基于块的区域增长算法得到每个对象的大致运动区域;然后部分解码属于运动区域的块,并把被还原的每个位置的像素值分布视为高斯分布,用统计的方法建立其高斯模型,通过阈值判断可靠地提取出最终具有像素精度运动对象。仿真实验表明,该算法可以有效地去除运动矢量噪声的影响,分割精度显著提高,并且具有较高的处理速度。