论文部分内容阅读
随着多媒体和网络技术的迅速发展,多媒体数据正以指数级别的速度增加。其中,视频信息最为复杂。视频信息的快速增长,使得人们对其进行快速、有效地检索和管理越来越困难。为了有效节省计算机的内存资源,视频数据通常以压缩方式进行存储。但是,压缩存储的视频会增加视频检索的负担。目前视频检索算法大都基于像素域,这些算法也取得较好的效果。但是,这些算法在处理压缩视频数据时,必须首先进行解压缩处理,这将花费大量的时间及计算机资源。因此,如何有效利用压缩视频的固有特征直接在压缩域中对视频进行快速、高效地检索和管理,成为目前视频检索研究中亟待解决的问题。
本文在综合分析目前基于压缩域的视频检索方法的基础上,尤其是在深入研究现有的压缩视频镜头检测和关键帧提取算法的基础上,提出基于Ⅰ帧相似度跳跃式计算的镜头检测算法和基于两次检测曲线的压缩视频关键帧提取算法,并设计一个简单的压缩视频检索的原型系统。具体研究内容如下:
(1)提出基于Ⅰ帧相似度跳跃式计算的镜头检测算法。该算法利用视频压缩编码的原理,按照MPEG标准,提取压缩视频的固有特征-Ⅰ帧DCT变换之后得到的DC系数,然后对其进行相似性计算并依此作为视频镜头检测的特征。提出的算法不是顺次计算两帧之间的相似度,而是以指数增长的跳跃式方式计算两帧之间的相似度从而达到确定镜头边界范围的目的,最后在确定的边界范围内利用二分查找算法定位镜头边界帧,从而将镜头检测算法的时间复杂度降为O(log2N),达到提高视频镜头检测效率的目的。
(2)提出压缩域下基于DCT系数的关键帧提取算法。该算法在传统的单一使用DCT变换得到的直流系数(DC)作为特征的提取方法基础上,增加DCT变换后得到的交流系数(AC)特征,并对其进行特征融合计算得到融合特征。然后结合曲线上高曲率点表示显著变化的思想,运用提取出的融合特征构建曲线,进而使用曲线进行关键帧的筛选、提取。提出的关键帧提取算法在提取关键帧的过程中无需对视频进行完全解压缩处理,因此能够达到节省时间资源和计算机内存资源的目的。实验结果表明该算法提取的关键帧可以有效地反应出镜头的主要事件并且具备较好的冗余。
(3)为验证本文提出算法的有效性,采用面向对象的软件设计方法,利用C++程序设计语言以及OpenCV2.1开放视觉处理库在Microsoft Visual Studio2005开发平台上设计并实现基于内容的压缩视频检索的原型系统。该原型系统主要包括:视频预处理、镜头相似度计算、镜头边界检测、特征提取、关键帧提取等功能。