基于时空信息融合的视频目标分割算法研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:sly4352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频目标分割是旨在从视频序列中将前景目标与背景区域分离的二值标记问题。视频目标分割的难点在于由于视频内容的丰富性,导致视频内容场景复杂。同时,由于视频往往包含了丰富的运动信息,从而引起物体之间存在遮挡、快速运动、形变等,给准确、稳定的目标分割任务带来了严重的挑战。近年来视频数据的大量积累,而人工处理的方式却要耗费大量人力财力,然而大多数现有的研究成果在质量和效率方面仍然存在严重的局限性,充分利用视频所包含的丰富的时空信息有利于解决视频目标分割中存在的问题,因此基于时空信息融合的视频目标分割算法研究具有很重要的理论意义和实际使用价值。本文对视频目标分割的多个研究角度分别进行了研究,形成由半监督单目标分割到无监督单目标分割,再到半监督多目标分割的研究路线。本文的主要研究工作总结如下:1、提出了基于时序连续性的自适应半监督视频目标分割算法。针对于半监督视频目标分割中,当物体发生较大的形变和位移时引起的分割不准确问题,提出了基于物体外观与运动变化度量的动态自适应分割算法,解决了半监督视频目标分割中网络不能很好的适应物体变化的难点,提高了分割的准确性。其次,为了解决使用CRF作后期优化处理耗时的问题,提出了轻量级的基于区域空间相关性的二值掩码离散点簇优化算法。在DAVIS、GYGO、Segtrack-v2以及VideoSD数据集上进行了对比实验,实验验证了本文提出算法的有效性,在分割准确度上优于当前主流方法,将精度提升到0.883。特别是针对于目标与给定第一帧发生了较大的外观或形状变化时,本文具有更好的鲁棒性。2、提出了基于外观与运动显著性的无监督视频显著目标分割算法。该算法以集成显著性检测模块生成候选显著区域作为辅助以分割出视频流中的显著物体。首先,针对于无监督视频显著物体分割对视频流信息利用不充分的问题,提出了新颖的基于外观和运动显著性的自成长视频显著目标分割算法,该方法与主流的分割方法不同,以网络自成长的方式,使视频流中的显著物体逐渐凸显。针对于多模型融合以及像素级的分割导致的物体区域丢失、区域不完整的问题,提出了基于轮廓约束的区域生成优化算法。算法在DAVIS单目标数据集上和主流的无监督视频目标分割算法进行了实验验证,分割精度达到0.706,优于大部分对比算法。同时,本文提出的算法可以通过替换性能更好的辅助模块来提升总体的分割性能,本文提出的算法比对比算法具有灵活性的优势。3、提出了基于半监督自适应网络的多目标视频目标分割方法。首先构建了基于半监督自适应视频分割的多目标分割框架。在半监督单目标分割的基础上,将视频多目标分割任务分解为多个单目标分割任务。针对于多目标分割存在区域遮挡、混淆等,而导致的重叠区域判别问题,提出了基于物体外观相似性度量算法对重叠区域分类。在DAVIS多目标分割数据集上进行了对比实验,实验结果表明本文提出的算法对于视频多目标分割是有效的,在DAVIS验证集上的分割精度达到0.643。本文包含图28幅,表9个,参考文献70篇。
其他文献
基于图像序列的表面重建在医疗分析、教育演示、电力维修、游戏电影制作、赛事直播互动等行业有着广泛的应用。经过数十年的迭代成果显著,但仍然存在一些未能完美解决的问题,
在我国乃至世界广大范围内,肺癌被认为是最常见的恶性癌症之一,也是其死亡率最高的恶性肿瘤。本论文对于中心型肿瘤肺癌的基于PET/CT序列影像处理刚性配准算法的应用做了进一
2013年《公司法》的第二次修订引入资本认缴制,有限责任公司市场准入要求放松了,不再需要最低注册资本限额和验资程序的要求。公司只需要在营业执照写明注册资本,出资期限由
多旋翼微型无人飞行器由于具有模型结构简单,体积小巧和机动性强等特点得到了大量研究关注。其大多数应用离不开两个基本能力:感知定位能力与规划控制能力。在传统的四旋翼微
自由贸易试验区(下文简称“自贸试验区”或“试验区”)是我国对外开放的探路者,在区内实行资本项目开放的试点就是我国探索金融开放的重要举措,也是逐步完善金融体制过程中隔
传统的无线定位算法假设信号基于视距(Line-of-sight,LOS)传播,但在实际的室内环境下,由于障碍物的存在,信号传播会经过多条路径到达接收端,产生非视距(Non-line-of-sight,NLOS)误差。NLOS误差的存在不仅影响定位精度,也使得目标节点与足够数量的参考节点进行通信十分困难。鉴于单一定位技术达到的定位精度有限,论文基于节点间的距离和节点的速度,从技术融合的角度,采用协作
随着高新科技的不断发展,产品设计和生产自动化程度的不断提高,复杂曲面的应用也越来越广泛。当前的CAD建模技术已经可以设计出外观上令人满意且光滑的复杂曲面,但是这些复杂
地名属于社会基本的公共信息,与人们的日常生活息息相关,同时地名也是地方历史文化的重要载体。地名更名是包括政治、经济、文化、社会管理等诸多内容的重大行政决策行为,它
慈善事业中国自古有之,而随着互联网的不断发展,慈善事业也逐渐由线下转移到了线上,各种募捐系统层出不穷。但是,近年来各个慈善机构丑闻不断,随之爆出的贪污受贿等问题冲击
在我国平安城市计划开展以来,人们对公共场所的人身与财产安全的关注度越来越高。利用大量的视频监控摄像头快速、准确地获取公共场所的人像信息对城市公共秩序的管理以及刑