基于内容的视频检索研究与实现

来源 :四川大学 | 被引量 : 0次 | 上传用户:gaolei000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着光电技术、计算机技术、网络技术和信息技术的迅速发展,海量多媒体信息的浏览和检索成为多媒体信息研究的热点。集图像、声音、文本于一体的视频信息是应用最多的一种多媒体信息,也是多媒体信息研究的重点之一。 在国内外众多研究者的努力下,以数字图像处理、数字视频处理为核心的视频检索技术取得了长足的进展。但是,高效、实用的视频检索技术研究和系统开发仍是人们面临的一项难题。 本文在回顾总结视频检索背景和相关工作的基础上,研究了视频检索中的视频镜头分割和视频结构索引两项关键技术,设计并实现了基于内容的视频检索系统。具体内容包括: 1.提出了一种新的镜头分割算法:基于机器学习的压缩域镜头分割。在视频数据中,编码生成的运动矢量、残差能量等差分预测信息可以很好的体现视频图像特征变化。结合MPEG编码的多尺度帧结构特性和差分预测特征,本文提出了压缩域中一种新的镜头分割算法,该方法的基本思路是:应用机器学习的方法在MPEG编码帧的多个尺度上学习差分预测特征的变化规律,以此为模板检测视频序列中的镜头边界,实现镜头边界的快速准确检测。实验表明,该方法在确保检测精度的情况下大大提高了检测效率。 2.进一步完善视频结构索引的机制:为了能够快速随机地访问视频数据,就需要为视频的结构信息建立索引。利用视频数据的编码结构信息和内容结构信息,文中实现了基于数据库的视频结构索引。基于数据库的视频结构索引解决了实时视频浏览和检索的问题。 3.视频检索系统的设计与实现:视频检索系统的实现是一项细致、复杂而又庞大的工程,其间涉及到许多关键技术,比如视频流的解析、视频信息的建模表示、浏览检索机制的建立等。视频信息的建模表示指视频数据的结构和内容信息的挖掘与描述,比如镜头分割、视频索引、视频图像的特征提取、字符检测识别、人脸检测识别、语音识别等。通过积累实验室多年来的研究成果和开发技术,本文设计并实现了一个功能全面、性能高效的
其他文献
自从1984年德国教授格莱特首次采用惰性气体中蒸发、凝聚制备出具有清洁表面的纳米金属粒子,纳米材料就由于其独特的物理、化学性质,以及在催化剂、陶瓷工业、磁学、光学以及生物医学等方面广泛的应用前景,引起了人们极大的兴趣。而新颖、简单、可控制、可重复的纳米材料的制备方法以及新型的纳米功能材料的制备以及研究是目前纳米技术的新阶段。基于此种考虑,本论文主要就一种大尺度合成球形BN和类球形AlN的方法加以研
I的半衰期为15.7Ma。尽管原始核合成的I现在都已经衰变为Xe了。但大气及地壳中能源源不断地生成I。在大气层中,I可由宇宙射线与Xe发生散裂反应生成,小部分可由中子与Te反应生成
广义相对论理论预言了引力波的存在,而引力波的直接探测作为验证广义相对论的手段已成为当今物理领域内的重大课题。然而由于引力场方程的复杂性使其在通常情形下无法解析求解
今年是中国共产党成立90周年。90年来,我们党肩负民族独立、人民解放和国家富强的神圣使命,坚持把马克思主义基本原理同中国具体实际相结合,团结带领全国各族人民,历经千锤百
师范生毕业顶岗实习普遍存在高师院校“单头热”现象.师范生教育实践能力与教师职业关键素质培养需要出发发挥中小幼学校的师资培养主体功能.本文以学前教育专业为切入口,对
我们使用原子嵌入势(Embeddedatommethod)来描述原子间的相互作用,研究了Pt(111)表面上吸附三聚物和六聚物的自扩散现象。结果显示,三聚物的扩散比较简单,包括整体平移扩散过
本文考虑纤锌矿结构的氮化物半导体材料的单轴异性,在有效质量近似下采用变分理论研究了体材料杂质态结合能及其极化子效应;计及电子有效质量,材料介电常数及晶格振动频率随流体
现代教育技术在高职教学过程中使用越来越多,如何让它在实际的教学中达到最佳的效果是很多老师都关心的一个问题,多年教学实践告诉我们,需将传统教学经验与现代教育技术进行
磁流体是一种具有磁性的纳米材料,它具有液体的流动性和光学性质可调谐的特点,是一种新型的光学功能材料。本论文主要研究纳米磁流体的相关光学性质,并探讨其在光子器件上的应用
马克思主义理论是发展着的理论,“马克思主义具有与时俱进的理论品质”(1)。在长期的革命、建设和改革实践中,马克思主义不断得到丰富和发展。“三个代表”重要思想正是继承