视频摘要技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:xiaoyan_0532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和网络技术的迅速发展,使得基于多媒体信息内容的浏览、检索和交互操作等应用越来越广泛。而作为各种媒体中形式和内容最丰富的媒体类型,视频,则受到用户越来越多的青睐,如视频点播、交互电视、视频网站的大量涌现。然而由于视频数据线性的、非结构化的本质决定了无法对视频数据直接进行基于内容的快速检索和浏览,并且原始视频数据的直接递送需要消耗大量的资源。为降低数字视频的存档、分类及索引,以及改善视频数据的存取及利用,就需开发、研究和设计新的数字视频技术,这一技术便是基于内容的视频检索技术。目前,该技术已成为国际上多媒体领域研究的一个热点问题,而基于内容的视频摘要技术作为基于内容的视频检索技术的一个重要组成部分,同时也是一种对视频进行快速检索的有效工具,近年来受到了越来越多的研究者的关注,逐渐成为视频信息技术领域研究的一个重要课题。
   基于内容的视频分析和视频检索是近年来一个非常活跃的研究方向,其基本研究目的是设计和开发自动的算法和系统,为视频数据的组织、管理和应用提供有效的手段;而视频内容结构化和视频摘要是其中的两项关键技术和核心技术:视频内容结构化通过将连续的媒体数据离散化为易操作的单元,奠定后续内容表征、摘要、浏览和检索的基础;视频摘要简明扼要地总结了长视频文档的内容,提供给用户概观视频内容的途径和非线性浏览视频的方式,同时它也是视频索引和检索系统的一部分。鉴于其重要地位和功能,本论文在分析现有视频结构化和视频摘要相关技术的基础上,提出了一些方法,并实验验证了这些方法的有效性。
   在该研究领域,本文将首先对视频摘要技术的概念、特性要求以及实现方法进行了较为全面的评价。在分析、比较现有视频摘要技术的基础上,抽象出视频摘要技术的一般流程,进而给出静态视频摘要和动态视频摘要新的生成方法。
   视频内容结构的分析就是通过镜头边界的检测,把视频分割成基本的组成单元—镜头。在镜头边界检测问题上,本文使用基于图像二维直方图熵的机制分析视频文档的图像信息,进而采用渐进的方法实现镜头边界的检测。该方法可在去除由光照变化而引起的虚假检测的同时,实现镜头不同变化类型的检测。实验结果表明该方法可以适合不同类型的视频,并具有较高的查全率和查准率。
   在基于内容的视频摘要中,视频分割成一系列的片段或镜头之后,为了有效地建立视频摘要,必须提取每个视频片段或镜头的关键帧。关键帧用于描述一个片段或镜头的主要内容,因而对于关键帧的提取,以实现对原始视频内容具有较好描述能力为准则。我们将依据镜头或片段内容的复杂程度,从中选取一个镜头中提取一个或多个关键帧,这样选取的关键帧更具代表性,并以提取的关键帧构建原始视频的静态视频摘要。
   在分析场景内镜头间内容分布特点的基础上,本文采用电影编辑的原理,将视觉上具有相似内容以及时间上相近的镜头判别为来自同一场景。电影语法的融入,保证了场景分割的合理性,并有效地减少了过分割与低分割。此外,本文融合了人脸参数、音频信息、图像特性等量化指标,将捕获的场景划分为多种常见类型的场景,以实现场景的语义表达并为最后的视频摘要提供基础。
   结合视频摘要的一类重要应用一电影剪辑,本文研究影片剪辑的特性要求及影片剪辑生成的相关问题。充分利用各种多媒体融合分析手段,提出一种适用于电影视频、面向事件的影片摘要生成方法。该方法使得对原始视频内容的缩减和保持均有据可依,所生成的视频摘要在压缩表示视频内容的同时,能够较好地反映原始视频故事情节的演变过程,且突出了本质内容。
其他文献
学位
期刊
期刊
期刊
期刊
期刊
期刊
期刊
报纸
会议