面向MPEG-4的视频分割算法研究

来源 :中国科学院电子学研究所 | 被引量 : 10次 | 上传用户:s66_ch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MPEG-4最重要的特点是用音频-视频对象来描述内容和进行编码。这需要按照视频对象进行视频图像分割。这个问题本身非常复杂,到目前为止还没有一个很通用的成功方法。在MPEG-4标准中,视频对象的分割仍然是一个开放部分。作为MPEG-4最基本的出发点,视频分割算法的好坏对最终产品至关重要。正是基于这种考虑,本文选择了这一课题。 本文研究视频对象分割算法,侧重于高速算法和实时实现方法。本文方法的要点是利用视频对象运动的一致性。这要求对物体运动的估计精度足够高,计算速度足够快,为此本文提出了一种基于多分辨率分解的参数化运动估计算法。为了充分利用物体运动的相关性,需要利用物体的运动信息进行视频对象跟踪。 本文工作的贡献主要反映在以下三个部分。 1.在参数化运动的多分辨率估计中,首先对图像进行小波分解,然后从低分辨率到高分辨率逐级估计物体的运动。在每一分辨率下,利用最速下降法对初始运动估计进行调整。在最低分辨率下,利用光流场方法求出物体运动的初始估计。高分辨率下物体运动的初始估计是把低分辨率下的结果进行投影而得到的。为了减少模型失配对运动参数估计的影响,需要使用稳健估计方法。本文把M估计算子嵌入到多分辨率估计算法中,可以提高运动估计的精度。运动估计计算负担很重,为了适应实时处理的要求,硬件实现不可避免。本文给出了基于文中算法的一种硬件实现结构框图。 2.与通常所见到的视频对象分割算法不同,本文中的方法利用对象运动的一致性来分割视频对象。逐个估计图像中的运动,不同的运动对应着不同的支撑区域,不问的支撑区域对应着不同的视频对象。与通常方法相比,本算法的计算速度明显要快。 3.在进行视频对象的跟踪时,先利用运动信息投影视频对象,得到一个初始分割。再利用对象运动的一致性对边缘像素进行调整,就可以得到最后的分割结果。为了提高算法的效率,本文设计了一种正、逆光栅扫描方式的搜索方法。计算机模拟表明了本跟踪算法的有效性。 目前已报道的面向MPEG-4的视频对象分割算法都缺乏通用性,还有许多工作需要进行更深入的研究。算法的硬件实现是一个很富挑战性又必须解决的问题。这些问题也是本文作者将来的努力方向。
其他文献
中国总书记习近平反复总结和分析了中国特色经济稳步发展的形势,特殊强调中国经济发展早已迈入新常态。认识并了解新常态,接受新常态,领导新常态是当前和未来一段时间中国经
目的探讨社会支持对军队老年人生命质量的影响。方法采用SSRS量表和SF-36中文版量表对成渝地区老年军人进行调查,并用多元逐步回归方法分析。结果影响SF-36量表总分的社会支
针对油罐内壁防腐涂料涂装前都必须对油罐表面进行处理(即除锈)的不足,研究开发了一种新型带锈涂装的油罐抗静电防腐涂料,介绍了该涂料的原料组成、防锈机理、配方、技术指标
数字签名可以解决否认、伪造、篡改以及冒充等网络数据传输和存储中的重要安全需求, 因此它在网络化的信息传输时代充当着非常重要的角色. 本文主要研究了适用于有特殊需求场
合成孔径雷达(Synthetic Aperture Radar,SAR)从其诞生之日起就在军事和民用建设中发挥出了巨大作用,她所具有的全天候、全天时、全空域的独特特点,使其得以广泛应用。近十多年
日本汽车业竞争力的本质就在于构筑了一套基于“系统组织能力(capability)”的“深层竞争力”。
Google探营 拉里·佩吉与他另位创业伙伴塞吉布林并非搜寻引擎的第人,但是他们能够在网络丛林中,走出一条属于自己的路,从而创造出第一。2004年底,美国《商业周刊》发行创刊
1后桥异响1.1齿侧间隙过大过小的响声主减速器各轴承预紧度正常情况下,在汽车起步短时间内或换档时,后桥处出现金属撞击声,当车速稳定后,撞击声变为连续的噪声,当油门急剧变
目的分析宫颈液基细胞学检查结果为意义不明的非典型鳞状细胞(ASCUS)及非典型腺细胞(AGC)患者的病理变化,探讨其临床意义及处理原则。方法回顾性分析2008年3月至2009年2月接受宫颈
“五”这个数字反复出现:五种协调机制、组织的五个基本组成部分、五种组织结构。“五”在明茨伯格这个犹太人心里似乎有一种冥冥之中的奇妙含义。