论文部分内容阅读
随着现代信息技术的飞速发展和信息资源的不断膨胀,对信息的处理、操作与表达提出了越来越高的要求。视频图像作为一种主要的信息表达形式,包含着丰富的内容,对其处理从简单的压缩趋向于基于视频对象的操作和表达,如基于对象的视频编解码,基于内容的视频索引等。因此,基于语义对象的视频分割己成为目前数字视频信息处理和计算机视觉等领域中世界性的研究课题和相关产品开发的热点之一。视频内容的复杂性使视频对象的自动分割需要大量复杂的计算,并且计算量随分割准确性要求增加。然而,视频应用通常要求处理具有实时性,如点对点的视频无线传输等,这样就出现了视频处理的实时性和准确性之间非常突出的矛盾。如何有效地实现基于对象的视频分割,从而减少视频传输带宽、存储空间,实现其灵活的操作,具有重大的理论意义和实际价值。
为了满足视频图像实时传输与处理的要求,描述了视频分割领域研究的发展线索及目前的状况,着重分析了不同视频对象分割算法的性能和效率,给出了视频对象分割与特征表达的基本结构。
视频图像质量是影响分割效果的重要因素,为了克服噪声和图像对比度对视频对象分割的影响,提出了基于形态学操作的噪声抑制和图像增强方法。该方法利用形态学重构开和闭操作,提取不同尺度的特征图像,利用特征图像中连通分量的分布关系,从而实现对图像中噪声的估计。在此基础上,通过减少小尺度的图像特征达到抑制噪声的方法,而增加大尺度特征分量实现了图像的增强。同时,根据形态学塔的特点给出了该方法实现的基本结构。
通过对现有分割算法的进行深入研究,提出了一种新的小波域视频对象分割算法。该方法通过对视频图像小波域的低频和高频分量运动特征分析,实现从低分辨率到高分辨率的视频对象分割,从而降低对象分割的计算量,并获得更准确的视频对象。由于视频序列中对象运动通常是缓慢、连续、非刚性的,利用多帧视频图像运动特征分析方法来获得在低分辨率下对象运动边界,结合对象的空间特征,从而保证了对象提取的完整性。此外,多帧视频图像运动信息的使用,可减少图像中噪声对分割的影响,从而实现对象的准确分割。
建立了以连续视频对象平面之间的平均绝对差为基础的控制策略。由于不同视频图像中的不同视频对象的运动是不同的,所表现的运动变化特征不同,通过对连续两帧的视频对象平面的图像变化,判断对象的运动程度,从而确定对象分割中所使用的图像帧数,保证视频对象分割的一致性。
目前已报道的基于对象的视频分割算法很多,但大多数缺乏通用性,且计算量比较大。基于小波域运动特征分析的对象分割算法可减少对象分割的计算量,从而满足视频应用的实时要求,同时保证了对象分割的准确性和一致性。虽然该方法在通用性方面做了一些努力,但还有许多工作需要进行更深入的研究。其中视频对象分割还需结合对象跟踪进行处理,以进一步保证对象分割的精度。这些问题也是将来的努力方向。