基于DCT系数的镜头检测和关键帧提取算法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户：cmxhjjcz

【摘要】

：

随着多媒体和网络技术的迅速发展,多媒体数据正以指数级别的速度增加。其中,视频信息最为复杂。视频信息的快速增长,使得人们对其进行快速、有效地检索和管理越来越困难。为

【作者】

：

张小丽

【机构】

：

江苏大学

【出处】

：

江苏大学

【发表日期】

：

2012年期

【关键词】

：

压缩域视频检索镜头检测跳跃式计算高曲率检测关键帧提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着多媒体和网络技术的迅速发展,多媒体数据正以指数级别的速度增加。其中,视频信息最为复杂。视频信息的快速增长,使得人们对其进行快速、有效地检索和管理越来越困难。为了有效节省计算机的内存资源,视频数据通常以压缩方式进行存储。但是,压缩存储的视频会增加视频检索的负担。目前视频检索算法大都基于像素域,这些算法也取得较好的效果。但是,这些算法在处理压缩视频数据时,必须首先进行解压缩处理,这将花费大量的时间及计算机资源。因此,如何有效利用压缩视频的固有特征直接在压缩域中对视频进行快速、高效地检索和管理,成为目前视频检索研究中亟待解决的问题。　　本文在综合分析目前基于压缩域的视频检索方法的基础上,尤其是在深入研究现有的压缩视频镜头检测和关键帧提取算法的基础上,提出基于Ⅰ帧相似度跳跃式计算的镜头检测算法和基于两次检测曲线的压缩视频关键帧提取算法,并设计一个简单的压缩视频检索的原型系统。具体研究内容如下:　　 (1)提出基于Ⅰ帧相似度跳跃式计算的镜头检测算法。该算法利用视频压缩编码的原理,按照MPEG标准,提取压缩视频的固有特征-Ⅰ帧DCT变换之后得到的DC系数,然后对其进行相似性计算并依此作为视频镜头检测的特征。提出的算法不是顺次计算两帧之间的相似度,而是以指数增长的跳跃式方式计算两帧之间的相似度从而达到确定镜头边界范围的目的,最后在确定的边界范围内利用二分查找算法定位镜头边界帧,从而将镜头检测算法的时间复杂度降为O(log2N),达到提高视频镜头检测效率的目的。　　 (2)提出压缩域下基于DCT系数的关键帧提取算法。该算法在传统的单一使用DCT变换得到的直流系数(DC)作为特征的提取方法基础上,增加DCT变换后得到的交流系数(AC)特征,并对其进行特征融合计算得到融合特征。然后结合曲线上高曲率点表示显著变化的思想,运用提取出的融合特征构建曲线,进而使用曲线进行关键帧的筛选、提取。提出的关键帧提取算法在提取关键帧的过程中无需对视频进行完全解压缩处理,因此能够达到节省时间资源和计算机内存资源的目的。实验结果表明该算法提取的关键帧可以有效地反应出镜头的主要事件并且具备较好的冗余。　　 (3)为验证本文提出算法的有效性,采用面向对象的软件设计方法,利用C++程序设计语言以及OpenCV2.1开放视觉处理库在Microsoft Visual Studio2005开发平台上设计并实现基于内容的压缩视频检索的原型系统。该原型系统主要包括:视频预处理、镜头相似度计算、镜头边界检测、特征提取、关键帧提取等功能。

其他文献

一种基于IP-SAN的数据流容灾方法研究

随着信息技术的发展，网络存储技术迅速发展，IP-SAN成为一种重要的网络存储解决方案。随之而来的数据集中化存储为数据的容灾提出了更高的要求。传统数据备份技术的恢复点目标已

学位

IP-SANiSCSI数据容灾持续数据保护

粗糙集并行约简算法研究

粗糙集理论利用上近似集和下近似集的概念解决了经典逻辑理论中模糊概念的可计算性问题,因此它在处理不完全、不精确数据时有其独到的优势：1)粗糙集理论不需要先验知识；2)相对

学位

粗糙集决策表约简并行约简代数信息论

基于SVM的JPEG图像隐写分析研究

数字图像隐写是一种将秘密信息嵌入到可公开的数字图像中进行信息隐藏并实现信息传递的隐蔽通信技术。其可用于军事、商业等领域，在为社会带来一种新的隐蔽通信手段的同时也带

学位

JPEG图像DCT系数隐写分析共生矩阵差分SVM

无线传感器网络中火灾监测系统的研究与实现

随着对无线传感器网络研究的加深，无线传感器网络已经被应用于实际的环境监测，火灾监测是其中一个重要的应用。但是目前基于无线传感器网络的火灾监测系统存在两个问题：(1)由于

学位

无线传感器网络火灾监测时间序列预测神经网络等值线查询

交叉纤维的分离算法研究

服装产品品质很大程度受所用的纤维种类和纤维混合比例确定。纺织品中主要采用的纤维为棉、毛、天丝、苎麻等。对纺织纤维的判别是我国纺织进出口检验的一个重要环节。目前基

学位

交叉纤维清晰度图层号多焦面

基于关系数据库的XML文档模型映射方法研究

可扩展标记语言(eXtensible Markup Language,XML)具有平台无关性、自描述性、简单性等优点,它已迅速发展成为Internet上数据表示和交换的标准。互联网上XML数据的不断增长,

学位

可扩展标记语言关系数据库文档模型映射方法查询效率文档更新

多核图像处理并行设计模型的研究及应用

图像处理面临数据量大,处理速度慢等问题,人们研究和采用基于并行机或并行集群的图像并行处理技术,以提高图像处理的效率。随着多核架构的出现,多核并行技术成为提高图像处理

学位

多核并行技术图像处理并行设计并行粒度划分

基于MPI的层次聚类算法的研究及实现

数据挖掘领域涉及很多方面的知识，聚类分析是该领域中的技术之一，也是该领域中重点研究内容之一。聚类分析实际上是对数据集进行分类、分组的一种方法。聚类分析应用广泛，在机器

学位

聚类分析层次聚类排序并行算法MPI

基于移动终端的可信身份认证方案

随着移动互联网的发展,移动终端在日常生活中占有越来越重要的地位,同时随着软件即服务模型的盛行,越来越多的移动终端使用云服务完成相应的功能。在使用移动终端享受各种快

学位

隐式认证多属性决策动态口令FIDO协议云服务

基于dPMR协议的中频数字接收机技术的研究

根据信息产业部无线电管理局下达的信无函[2002]127文、信无函[2002]10文和信无函［2009］666号文中对900M频率资源的政策以及欧洲电信标准联盟(ETSI)针对民用数字对讲机推出的dP

学位

中频数字接收机载波同步锁相环锁频环数字下变频奇数倍抽取因子

基于DCT系数的镜头检测和关键帧提取算法研究

与本文相关的学术论文