压缩域中的视频特征提取与应用的研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户：a175758624

【摘要】

：

随着视频采集、存储和压缩编码技术的发展，数字视频数据的数量迅猛增长。目前，关于视频的应用已经从最初单纯的播放操作，发展到要求对视频内容进行访问和操作的更高层次，如视频索

【作者】

：

唐志峰

【机构】

：

中国科学院声学研究所

【出处】

：

中国科学院声学研究所

【发表日期】

：

2007年期

【关键词】

：

压缩域视频特征提取镜头边界检测视频目标分割压缩编码

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着视频采集、存储和压缩编码技术的发展，数字视频数据的数量迅猛增长。目前，关于视频的应用已经从最初单纯的播放操作，发展到要求对视频内容进行访问和操作的更高层次，如视频索引与检索，视频理解等。这些应用中的核心问题是如何有效地对视频内容进行表示以及有效地对视频内容进行访问。由于许多关于视频内容分析的算法是基于像素域的，需要在进行视频分析前对码流进行解码得到视频特征。而压缩的视频码流中存在反映视频内容的特征，通过直接利用从压缩的码流中提取的视频特征，可以避免解码运算，实现实时的视频分析算法。　　本文的研究主要集中在三个方面：压缩视频码流中的特征提取，利用从视频码流中提取的特征进行镜头边界检测，和利用从视频码流中提取的特征进行视频目标分割。主要的贡献为：(1)建立了压缩域视频特征提取和应用的研究平台；(2)提出了一种新的基于局部特征的实时镜头突变检测算法。该算法利用从压缩域中提取的边缘特征，通过考察相邻帧边缘分布的相似性定义了一种反映局部信息的帧间相似性度量。结合反映全局特征的基于彩色直方图的相似性的度量和改进的滑动窗算法，实现了高性能的镜头边缘检测。相对于现有的基于局部特征的算法，该算法具有更低的运算复杂度，适合于实时的应用。(3)提出了一种改进的基于模型的溶解镜头检测算法：算法在预选阶段采用亮度图像和梯度图像的统计特征互检验的方法显著地提高了查全率；在验证阶段，通过施加多个平行的限制条件，在保证仍有较高查全率的前提下，有效地去除了由摄像机或目标运动引入的误检。实验结果表明，该算法有效地提高了检测的性能。(4)提出了一种高精度的压缩域视频目标分割算法：该算法以压缩域中提取的特征为输入，提取P帧中的运动目标。算法首先采用I帧和P帧中每个块的直流DCT系数和3个交流DCT系数，以及运动补偿信息，重建出P帧的原图像1／16大小的子图像；然后采用快速平均移聚类得到具有较高边界精度的亮度一致的区域；接着利用全局运动估计和目标掩模反向映射得到潜在运动块的分布；最后结合聚类分析结果和潜在运动块的分布，采用基于马尔可夫随机场的统计标号方法对目标和背景区域进行分类。该算法可以得到4×4子块的边界精度，对于CIF格式的码流，在Pentium IV2GHz平台上可以达到每秒40帧的处理速度。

其他文献

Landsat-7 ETM+SLC-OFF图像缝隙数据修复算法研究

美国陆地卫星7号(Landsat-7)于1999年4月15日由美国航天局(NASA)发射升空，其携带的主要传感器为增强型主题成像仪(ETM+)。2003年5月31日，Landsat-7 ETM4+机载扫描行校正器(Scan

学位

陆地卫星数据重叠图像数据直方图匹配

Apontic在果蝇器官发育过程中的功能分析

转录因子具有结合DNA的能力，在生物发育过程中通过调控靶基因的表达发挥重要作用。对转录因子下游基因的鉴定能够很好地解释其功能。Apontic(Apt)是在果蝇中发现并在果蝇胚胎

学位

果蝇器官发育转录因子功能分析

基于MDA的J2EE应用框架realMethods研究与应用

J2EE作为企业软件的主力平台，技术已相当成熟，基于该平台的各层应用框架、中间件等产品也十分丰富。然而传统的基于多层框架的开发模式有一些不足之处：需要各层框架组合使用，配置

学位

模型驱动架构模型驱动架构中间件中间件软件复用软件复用软件开发软件开发软件方法学软件方法学

两轮同轴自动平衡载人小车

本文研究了两轮同轴自动平衡载人小车的原理及制作过程。所谓两轮同轴自动平衡载人小车是指使用者要双脚站在由两个轮子支撑的平板上，抓牢类似自行车的手柄，保持站立姿势，小车自

学位

平衡载人小车两轮同轴角速率陀螺信号读取倾角传感器

视频字幕检测与识别技术研究及系统实现

视频节目的字幕检测与识别是一个应用性很强的课题，构造高检测率、高识别率的检测识别系统是研究追求的目标。本文结合视频中字幕图像的特点探讨了相关问题。在视频节目的

学位

字幕检测字幕识别Gabor滤波器隐马尔可夫模型统计语言模型字幕图像处理

提高IEEE 802.11 MAC协议应对暴露和隐藏终端问题的能力

在多跳的情况下，无线Ad hoc网络的性能不甚理想，这主要是由于暴露终端问题和隐藏终端问题造成的。由于本身机制的制约，传统的IEEE 802.11 MAC(Medium accessCOntrol)协议并非是

学位

多跳情况多跳情况无线Adhoc网络无线Adhoc网络MAC方案MAC方案暴露终端问题暴露终端问题隐藏终端问题隐藏终端问题IEEE802.11协议IE

小学科学教学中核心素养教学路径分析

本文通过对荣华二采区10

期刊

小议我国古代谚语中的概率思想

摘要：文章通过从我国古代谚语中提取，“三人行，则必有我师”，用概率思想对其作一个崭新的诠释。并且联系现实生活，进一步说明这些思想在生活之中的体现与应用。　　关键词：古代谚语；概率思想　　随着科学的发展，数学在生活中的应用越来越广，生活的数学无处不在。而概率作为数学的一个重要部分，同样与生活有着密切的联系。人们习惯把数学称作自然科学的皇后，因为自然科学和数学有着密切的联系；但数学与社会

期刊

古代谚语概率思想

高速并行全数字遥感接收机中时钟恢复算法的研究与实现

由于遥感卫星图象分辨率的不断提高，下一代遥感卫星数据传输系统将面临高性能和高速率两方面的技术挑战。全数字接收机具有性能优越、可靠性高和适应性强，是遥感卫星地面接收设

学位

遥感卫星图象高速全数字接收机时钟恢复数据传输系统

哼唱检索系统的研究与实现

音乐哼唱检索研究是基于内容的音乐检索的一个分支，它是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究，其在internet音乐检索以及生活娱乐等方面都具有非常重

学位

音乐哼唱检索音乐哼唱检索基频提取基频提取旋律特征旋律特征分级匹配分级匹配音乐检索音乐检索模式识别模式识别

压缩域中的视频特征提取与应用的研究

与本文相关的学术论文