面向视频检索的关键帧选择技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jj80022084
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频数据的爆炸式增长,传统的基于关键字查询的不足逐渐暴露,基于内容的视频检索技术成为切实可行的提高检索质量的方案。由于视频数据在时间域上存在极大冗余,因此关键帧选择成为影响视频检索结果的重要环节之一。实验分析表明,关键帧选择不仅影响着视频检索的速度,而且与视频检索的效果紧密相关。本文针对现有关键帧选择方法存在的问题,提出了综合视频帧失真程度、信息量高低以及相似帧过滤的关键帧选择方案。主要成果如下:  1.基于自然场景统计的失真度度量方法  严重失真的视频帧可能降低视频检索的性能,需要合理去除。视频帧失真度度量方法很多,本文结合视频检索的应用需求,通过大量实验,分析了不同失真度度量方法的优缺点,最后将基于自然场景统计的评价方法用于视频关键帧的失真度度量。实验结果表明,基于自然场景统计的方法与人类主观评价结果具有较高的相关性。  2.基于分块信息熵的信息量度量方法  现有关键帧选择方法不考虑关键帧内容的丰富性,导致低信息量的视频帧存在于关键帧集合,不仅增加了视频检索的计算开销,甚至可能降低视频检索性能。为解决这个问题,本文提出一种基于分块信息熵的视频帧信息量度量方法。其主要过程包括:首先利用视觉注意模型对图像进行预处理;然后对图像进行分块,根据每个分块在不同方向上的颜色直方图计算信息熵,再结合均值、标准差、显著像素所占比例等信息,形成信息量描述特征;最后通过训练获得回归模型对图像的信息量打分。该方法充分考虑了影响图像信息量的因素,结合了视觉注意模型,能够对视频帧的信息量高低进行准确地度量。  3.融合特征提取的相似视频帧过滤方法  视频帧相似度不仅与帧的内容相关,还与视频检索中所使用的特征相关。传统方法通常在关键帧选择和检索阶段采用不同特征,导致图像的特征空间不匹配,影响系统的检索性能。本文分析并验证了特征空间不匹配所导致的检索性能降低问题,提出在关键帧选择和检索中采用相同的特征空间,实现关键帧选择与检索阶段的特征提取过程的融合。实验结果表明:融合特征提取的相似视频帧过滤方法,不仅有效减少了视频数据库的冗余,而且提升了视频检索的性能。  4.视频检索系统  融合上述关键帧选择方法,本文实现了视频检索验证系统,在所构建的测试数据集上,将本文采用的视频检索方案与原始基于底层视觉特征查询的视频检索方案进行了对比实验。实验结果证明,应用本文提出的关键帧选择方法,视频检索系统的性能和速度均获得了有效提升。
其他文献
该课题研究了一种基于几何约束的二维参数化设计的方法,是一种将基于构造过种的方法和变量几何法相结合的机制.通过记录构图过种中几何图素的生成过程的先后顺及连接关系,在
为了满足科学计算和商业应用日益增长的规模需求,计算机系统规模不断扩大。在现今的超算中心或数据中心,高性能互连网络需要互连高达数万甚至数十万个节点。作为计算机系统的传
计算机软件技术极大的促进了社会的信息化进程,从个人移动计算到企业云计算,丰富的软件生态为我们的生产生活提供了极大的便利。但是,在提供便利性的同时,计算机软件系统潜在
图像中的文本蕴含丰富的语义信息,这些信息是图像内容描述和场景理解的关键线索,对于图像检索、信息检测、场景分析和智能控制等应用有着巨大价值。同时,智能手机、数码相机等具
视频监控系统中的行人检测与跟踪是计算机视觉领域中一个活跃的研究课题,是进行个体识别、行为分析理解、异常事件检测等技术的基础,在交通、商业、军事和公共安全等领域具有重
该文首先介绍了软件测试的一些基本概念,以求从总体上对面向对象软件测试进行把握.接着该文分析了面向对象软件测试的特点,叙述了类的封装、继承和对象的多态性等特征在测试
心音听诊是诊断心血管疾病的重要手段,由于听诊不能对心音信号进行定量的、系统化的分析,限制了临床诊断的效果.该文给出了基于心音时频分析的心音成分识别方法,设计并实现了
无线传感器网络(Wireless Sensor Network,WSN)以Ad-hoc网络结构或分层结构来对传感器节点进行部署,通过传感器与外界交互完成数据采集、处理以及通信等功能,具有低成本、低功耗
学位
该文致力于实用化ATM用户接入设备的研究设计,完成恒定比特率(CBR)业务的电路仿真功能,为E1业务接入ATM交换网络提供了支持. CBR业务接入ATM网络必须遵循相关协议及电路仿真