论文部分内容阅读
视频目标分割是旨在从视频序列中将前景目标与背景区域分离的二值标记问题。视频目标分割的难点在于由于视频内容的丰富性,导致视频内容场景复杂。同时,由于视频往往包含了丰富的运动信息,从而引起物体之间存在遮挡、快速运动、形变等,给准确、稳定的目标分割任务带来了严重的挑战。近年来视频数据的大量积累,而人工处理的方式却要耗费大量人力财力,然而大多数现有的研究成果在质量和效率方面仍然存在严重的局限性,充分利用视频所包含的丰富的时空信息有利于解决视频目标分割中存在的问题,因此基于时空信息融合的视频目标分割算法研究具有很重要的理论意义和实际使用价值。本文对视频目标分割的多个研究角度分别进行了研究,形成由半监督单目标分割到无监督单目标分割,再到半监督多目标分割的研究路线。本文的主要研究工作总结如下:1、提出了基于时序连续性的自适应半监督视频目标分割算法。针对于半监督视频目标分割中,当物体发生较大的形变和位移时引起的分割不准确问题,提出了基于物体外观与运动变化度量的动态自适应分割算法,解决了半监督视频目标分割中网络不能很好的适应物体变化的难点,提高了分割的准确性。其次,为了解决使用CRF作后期优化处理耗时的问题,提出了轻量级的基于区域空间相关性的二值掩码离散点簇优化算法。在DAVIS、GYGO、Segtrack-v2以及VideoSD数据集上进行了对比实验,实验验证了本文提出算法的有效性,在分割准确度上优于当前主流方法,将精度提升到0.883。特别是针对于目标与给定第一帧发生了较大的外观或形状变化时,本文具有更好的鲁棒性。2、提出了基于外观与运动显著性的无监督视频显著目标分割算法。该算法以集成显著性检测模块生成候选显著区域作为辅助以分割出视频流中的显著物体。首先,针对于无监督视频显著物体分割对视频流信息利用不充分的问题,提出了新颖的基于外观和运动显著性的自成长视频显著目标分割算法,该方法与主流的分割方法不同,以网络自成长的方式,使视频流中的显著物体逐渐凸显。针对于多模型融合以及像素级的分割导致的物体区域丢失、区域不完整的问题,提出了基于轮廓约束的区域生成优化算法。算法在DAVIS单目标数据集上和主流的无监督视频目标分割算法进行了实验验证,分割精度达到0.706,优于大部分对比算法。同时,本文提出的算法可以通过替换性能更好的辅助模块来提升总体的分割性能,本文提出的算法比对比算法具有灵活性的优势。3、提出了基于半监督自适应网络的多目标视频目标分割方法。首先构建了基于半监督自适应视频分割的多目标分割框架。在半监督单目标分割的基础上,将视频多目标分割任务分解为多个单目标分割任务。针对于多目标分割存在区域遮挡、混淆等,而导致的重叠区域判别问题,提出了基于物体外观相似性度量算法对重叠区域分类。在DAVIS多目标分割数据集上进行了对比实验,实验结果表明本文提出的算法对于视频多目标分割是有效的,在DAVIS验证集上的分割精度达到0.643。本文包含图28幅,表9个,参考文献70篇。