论文部分内容阅读
近年来,随着以智能手机、数码相机等为代表的移动便携摄像设备的广泛普及,互联网视频数据量也随之爆炸性增长。大量的视频数据很大程度上丰富了人们的精神生活,但是如何对这些大量的视频进行有效的编辑,或者快速提取其中的有用信息,成为了一个亟需解决的问题。其中,对视频数据进行快速精确的分割,提取感兴趣的目标,并将分割的目标自然、真实地融合进另一个视频中,从而使视频更具趣味性,在诸如多媒体编辑、数字娱乐、影视制作、视频编码、安防监控、智能视频分析、视频检索等领域都存在大量需求。现阶段视频数据的分割和合成大量依靠人工逐帧完成,这样做通常需要耗费大量的时间和人力,而且效率十分低下。所以,如何让计算机具备对视频数据的快速分割和合成能力成为了近年来计算机视觉领域的一个研究热点。在计算机视觉领域中视频分割和合成都是基础性研究,现在都存在着大量的研究成果。然而,由于视频在环境和拍摄条件上的复杂性,特别是针对现阶段移动摄像端兴起的新形势,这个问题还没有得到完全解决。本文首先介绍了视频分割和融合的基本概念和基础理论,综述与分析了国内外的研究现状和主流算法。在此基础上,本文对传统的轨迹分析技术进行了改进并将其应用于视频分割框架中,分别提出了运动目标自动分割和交互视频分割算法。此外,本文还实现了一套基于轨迹分析的视频合成算法,能够将目标快速、准确、真实地融合到新背景中。本文的研究内容和创新点如下:1.提出了基于全局轨迹分析的运动目标自动分割算法。传统的长轨迹分析会导致大量阻塞区域的运动信息丢失,最终导致目标边界难以判断。本文通过设计轨迹距离度量方法,提出了短轨迹利用方案;同时基于超像素分割算法,提升了传统图割算法在前背景分割环节的精确度。实验表明该算法较传统方法精确度和稳定性都有大幅提高。2.提出了基于全局轨迹分析的交互视频分割算法。传统算法仅利用了两帧之间对应像素的关系进行标记的置信概率扩散,该方法没有考虑目标整体运动模式,在复杂环境下会造成严重的误差。在视频某一帧目标已经进行标记的情况下,相当于该帧中特征点已经被分类。本文以此作为训练集,根据目标检测算法中轨迹聚类部分,研究基于轨迹分析的交互视频分割算法。实验表明该算法在复杂环境、剧烈运动等传统方法失效的应用环境下有较好的鲁棒性。3.提出了一种基于单应性变换的视频合成算法。传统视频合成算法往往忽视目标对象和背景之间的相对运动,从而导致合成后目标和背景之间出现“漂移”,影响视频的视觉效果。本文使用了特征点之间的单应性变换对背景运动进行估计,并使用相同的方法对待合成的背景进行补偿。实验表明该算法确实可以消除合成视频中背景“漂移”现象。