时空联合视频对象分割算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:bvhd5467h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新一代多媒体标准MPEG-4和MPEG-7采用了面向对象、基于内容的视频编码和描述框架,包括基于内容的压缩、可扩展性和可交互性等方面内容。然而,MPEG-4和MPEG-7标准仅定义了视频编解码过程和接口描述的语法规则,并没有制定具体的视频对象分割方法。同时,语义视频对象在视频编码描述领域之外的视频监控、模式识别等众多领域有着广阔的应用前景。因此,如何从视频中有效获取视频对象就成为对象基视频处理技术的重要支撑和关键所在,对其进行研究具有重要的理论意义和重大的应用价值。 论文首先介绍了视频对象分割的基本概念和基础理论,综述了目前国内外视频分割技术的发展现状。论文指出:在众多的视频对象分割方法中,时空联合的视频对象分割方法综合利用了视频的时间和空间信息,更符合人眼视觉感知的方式,综合效果较好,表现出可喜的应用前景。但是算法的精确性、鲁棒性以及实时性等方面还没有达到令人满意的程度,与实际应用有相当的距离,需要进一步提高和完善。论文对现有的时空联合视频对象分割算法进行了分析和总结,以提高时空联合视频对象分割算法的速度和精度为目标,开展了一系列研究工作。 针对经典高阶统计时域运动分割算法计算量较大、经典空域分水岭分割存在过分割从而需要复杂的区域合并的问题,提出了一种基于分块高阶统计和形态学滤波的时空分割算法:(1)时域分割部分,提出了分块高阶统计运动检测的方法,较快地得到轮廓粗糙的前景运动区域,结合基于最大类间方差的阈值算法,通过后处理可以得到较为精细的视频对象运动检测模板,加快了时域分割的速度;(2)空域分割部分,从强调整体、淡化细节的思路出发,将交变序列重建滤波算法和分水岭算法有机结合,可以提取出分割区域的精确边缘,同时避免了复杂的区域合并。实验结果表明,该算法加快了时域运动检测的速度,提取出的视频对象边缘定位准确,有效避免了区域合并,对背景静止和经过全局运动补偿的视频均能取得较好的分割效果。 为了充分利用网格基分割算法计算量小、速度较快的特点,进一步提升分割算法的速度性能,同时解决传统网格基分割结果边缘与视频对象实际边缘不一致的问题,提出了一种改进的网格基视频对象快速分割算法。该算法用机器学习FAST算法检测视频帧的角点,然后将一个二维Delaunay网格匹配到这些角点上得到视频图像的二维网格表示,通过基于高阶统计的角点运动分析,快速得到粗糙的前景运动轮廓区域,接着采用基于象素的高阶统计运动分析方法对运动轮廓区域进行精细化,再经过后处理就可以获得最终的视频对象分割模板,从而有效地提取出前景视频对象。实验结果表明,该算法简单易行,加快了分割的速度,提取出的视频对象边缘与实际边缘一致,适用于背景静止和经过全局运动补偿的视频。 为了解决基于交变序列重建滤波的分水岭分割算法中结构元素大小需要人工交互确定以及局部梯度极值造成视频对象具有“背景毛刺”的问题,提出了一种形态学交变序列重建滤波算法和自适应阈值判别算法相结合的视频对象空域自动分水岭分割策略。在结构元素逐渐变大的形态学开闭重建滤波迭代过程中,大大减少了分割区域的数目,有效避免了复杂的区域合并,同时使得对象边缘象素的梯度与平坦区域内部象素的梯度更易区分,利用基于最大类间方差的阈值算法自动获得判别阈值,通过非线性变换进一步消除局部梯度极值造成的分割小尺寸区域,从而获得令人满意的视频对象空域分割结果。实验结果表明,该算法能自动获得合适的结构元素大小和非线性变换阈值,提高了算法的通用性和易用性,将应用该空域分割策略获得的空域分割结果与合适的时域分割结果相结合,就可以有效提取出具有精确边缘的视频对象。 为了自动、快速、精确地提取完整的初始视频对象,提出了一种基于运动连通性的初始对象分割算法。高度连通结构化的对象运动是适用于视频对象分割的高级特征,对反映对象一致性运动的累积帧差图进行尖锐噪声滤除,然后应用自适应阈值算法提取对象运动区域,之后根据运动连通性标记出最大连通区域,通过后处理得到视频对象的分割模板从而有效提取出初始视频对象。实验结果表明,该算法简单易行,对静止背景和经过全局运动补偿的视频均能获得较好的分割效果。
其他文献
无线传感器网络由于其无需基础设施、自组网、自管理等特点决定这种传感器网络可以应用于军事、环境、健康、家庭和其他商业领域。无线传感器网络中的路由技术则是关系到网络
在许多实际问题中,图像可能在获取、传输或者保存的过程中产生不可避免的缺陷,如医学扫描图像中的三维器官和病灶、遥感影像中的缺损现象、珍贵影像资料保存不善带来的划痕等
作为超宽带天线的一种形式,平面螺旋天线发展迅速,因其具有宽频带、圆极化、结构简单、低剖面、体积小、造价低等优势,目前已经被广泛的应用于军用电子对抗和商业领域。近年来,平
互联网的持续快速发展带来网络带宽的不断提高和各类复杂业务尤其是多媒体业务的出现,这要求网络连接设备必须具备线速的分组处理能力,并实现一定的QoS保证机制。网络流引擎
三维重建是计算机视觉领域的重要分支之一,它通过直接模拟人类视觉系统的方式感知客观世界,它综合了众多的学科知识,广泛的应用于航空测绘、视觉导航、医学诊断、电子商务、
提高雷达的距离分辨力一直是雷达技术研究与发展的方向。提高雷达距离分辨力不但有利于在强杂波背景下的目标检测,而且使目标成像成为可能。多载频相位编码信号作为一种新型
电影是人类历史上极其宝贵的艺术文化遗产。然而电影胶片本身是一种容易老化的化学物质以及不恰当地被保存、播放、拷贝,使得许多旧影片或损坏或丢失。保存和修复旧电影已经成
随着CMOS电路制造工艺特征尺寸的日益减小,集成电路在集成度和性能方面不断获得提高,芯片设计也逐渐朝着SoC方向发展。但与此同时,系统复杂性的提高以及各种移动设备的广泛使用,
高光谱图像具有丰富的光谱信息,因此也具有更高的分辨能力。当然,丰富的光谱信息也给高光谱数据的处理带来了非常复杂的问题,例如高光谱数据处理时间复杂度很高等,而稀疏表示
在人脸检测与跟踪研究中,如何能够快速的,鲁棒的检测和跟踪人脸一直是待解决的关键问题。针对这一关键问题,本文主要对人脸快速检测与跟踪方法进行了研究,具体如下:1.基于粒