论文部分内容阅读
传统的视频压缩编码标准MPEG—1/2和H.26x都采用基于帧的技术,不要求对场景进行分割,它们能获得较高的压缩比,并在很多领域得到广泛的应用。随着多媒体信息的日益丰富,人们不再满足于对视频信息的简单浏览,而要求提出基于对象的操作、交互等功能。为此,MPEG-4引入视频对象的概念,以支持基于对象的交互性和可分层性。视频对象的应用价值主要有:对不同的视频对象按其对视觉重要性分配不同的码率,可提高压缩编码效率;支持对象可分级,在较低的网络带宽时获得更好的视觉效果;用视频对象来组织视频内容,能实现基于视频内容的存储、交互和查询等功能。然而,MPEG-4尽管引入了视频对象的概念,它并没有指定从视频序列获取视频对象的具体方法。一方面,视频对象的语义一致性难以通过视频的低级物理特性来建模,使得针对各种视频序列的通用视频对象分割算法是一个尚未解决的经典难题;另一方面,针对特定的应用,往往可以利用先验知识设计相应的算法。本文在对传统的运动分割分割方法进行实现的基础上,研究和改进了两种获取视频对象的策略。为了克服利用变化检测分割视频对象过程中的噪声、复杂运动、暴露背景的影响,提出了一种基于三次求帧差边缘然后取交集的视频对象分割方法。该方法利用间隔为k帧的两帧图象代替连续两帧求帧差,可以很好地处理关节运动和慢运动;取三次帧差边缘的交集,可以有效地解决由于视频对象的运动所造成的背景遮挡和显露问题,并能消除背景噪声所造成的帧差边缘。然后,对三幅帧差图像边缘的交集进行行列扫描得到运动对象的轮廓,对轮廓的断裂点进行连接。最后,通过填充和数学形态学处理实现视频对象的分割。提高了对象分割的完整性。在基于hausdorff距离的对象跟踪提取策略中,提出了一种新的鲁棒hausdorff距离测度,实现了复杂背景中对局部遮挡/显露对象的准确跟踪,提高了传统改进方法的鲁棒性。在对分割和跟踪策略进行研究的同时,注意到算法的适用性,强调了运动分割与时域跟踪之间的紧密联系。在对象提取策略中加人了预处理或后处理方法,为算法的有效应用提供了保证。