论文部分内容阅读
当今社会对数字化视频的需求越来越多,对视频服务的要求也越来越高。除了要求更快的传输速度、更小的存储空间外,还需要即时点播(VOD)、远程视频通信(如视频会议)、远程医学诊断、视频数据库浏览和关键帧检索等更高级的视频服务。基于视频内容的处理技术是实现这些需求的主要措施,而对于基于内容的视频处理来说,视频对象分割是其关键技术。现有的基于单视点的视频对象分割技术还不能很好地对语义对象进行精确分割,而对于立体视频来说,可以获得单视点视频中所没有的深度(视差)信息,深度信息是接近语义的,这对于对象分割是十分有利的。本文采用基于视差分析的方法,结合边缘、运动以及颜色等多种线索,较精确地分割视频对象,解决了在时空分割中难以解决的问题,或者用相对简单的方法分割出在单视点视频中需用复杂方法才能分割的视频对象。
本文在比较了基于区域和基于特征的视差匹配各自优缺点后,实现了一种基于区域的视差估计方法。本方法采取优化搜索路径的措施提高了匹配速度。针对传统视差匹配计算量大、误匹配率高的问题,本文还提出了一种基于特征约束的立体匹配新方法。能在比较精确的边缘特征点视差值的约束下,将非边缘特征点的匹配搜索区域大大缩小,不但可以减少计算量,而且还能保证匹配的可靠性。
采用上述改进的基于区域视差估计方法,本文提出了一种基于视差和阈值的立体视频对象分割算法。首先对图像进行视差估计,并对所得到的结果作数学形态学的处理,然后针对不同的对象分别采用迭代阈值法和自适应阈值法进行二次分割,最终提取出对象。本方法适用于摄像机与静止景物之间有相对运动的立体视频序列的多对象分割问题。
采用所提出的基于特征视差估计方法,本文提出了一种基于多线索融合的立体视频对象分割提取算法。在视差分割的基础上,在不同的对象区域范围内采用不同的阈值进行运动变化检测;最后融合时空分割结果,并用颜色信息进行边界修正,最终得到准确的分割对象。本方法适用于含有重叠多对象的视频序列的分割问题。