基于BoF模型的视频检索技术

来源 :中南大学 | 被引量 : 0次 | 上传用户:zlq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着传统广播视频和新生网络视频数量的快速增长,如何从浩如烟海的视频中快速有效地检索到用户所需的信息逐渐成为多媒体技术研究领域的重要课题。传统的视频检索方法主要有两种:一种基于视频元数据,另一种基于视频底层特征,两者都不能实现基于语义和镜头粒度的视频检索。随着基于内容的图片检索技术和机器学习等相关领域的不断发展,基于语义的视频检索技术近年来引起了人们的广泛关注。本文针对基于语义的视频检索技术,重点研究了镜头边界检测和BoF (bag of features,特征袋)模型,并基于BoF模型实现了能够快速检索镜头(视频片段)的原型系统。该系统首先利用镜头边界检测将视频结构化成易于浏览和检索的镜头,然后使用从镜头中提取的关键帧构建视觉词典和数据库,最后在检索阶段利用反转文件和加权策略提高检索的速度和精度。取得的主要成果有:(1)提出了一种新的基于分块加权直方图和自适应阈值的镜头边界检测算法。实验结果表明,该算法能够很好地检测镜头突变和较好地检测常见类型的镜头渐变。同时,镜头边界检测使系统支持镜头粒度的视频检索。(2)系统采取不同的特征采样策略提取特征,构建了不同的视觉词典参与检索。实验结果表明,在检索场景类镜头时,密集采样特征比仿射协变特征具有更好的检索性能。(3)系统将检索到的镜头结果实时生成HTML5页面,利用HTML5的视频点播功能实现在线视频点播,为视频检索系统的互联网化提供了一个新的解决思路。
其他文献
虹膜识别系统的准确率与图像质量密切相关,劣质的图像会严重影响整个系统的识别率,虹膜图像质量评估的目的,就是筛选出这类图像,保证进入识别系统的图像是符合识别要求的高质
半监督学习是机器学习的一个重要分支,在近些年互联网爆炸式发展过程中,出现了大量的数据分类需求,半监督学习可以利用有限的已标记数据和大量的未标记数据来解决数据分类的问题
随着校园网络规模的扩大、应用的不断扩展,网络架构日益复杂,迫切需要对校园网络实现实时的监控、及时的预警和综合的分析。网络监测预警系统是了解网络运行状况的有效手段,
在电商化的推动下,脚型三维数据的获取工作在鞋类定做领域占据重要地位。传统的计算机多视觉几何算法对三维脚型进行重建需要满足各种各样的条件,如要求脚上纹理明显(要求数
多媒体互动应用一直以来都深受人们的喜爱,它可以以一种趣味的形式让用户站在一个新颖的角度去体验日常生活中可能出现的事件,甚至是处于想象中的事物。我们开发的多媒体互动
本体映射旨在构建异构本体间的语义桥梁,以实现不同本体间的知识共享和信息交流。但是,随着本体应用的不断发展,本体规模也在不断壮大,当前出现了一类概念数量庞大、相互之间
随着论坛、博客和微博等网络媒体的快速发展,表达人们情感、态度和观点的主观性文本大量出现。文本情感分析,也称意见挖掘,就是对这些主观性信息进行有效地分析和挖掘,并进一
随着数据规模的急速增大,应用种类的极大丰富,个人用户和企业对信息的需求已经远远超过了原有平台的能力。越来越多的应用和平台,不论对企业级还是个人级用户都不堪重负,Hadoop平
特征提取是模式识别中最基本的研究内容之一,可以有效地缓解模式识别领域经常出现的“维数灾难”问题并对识别性能起着重要作用,它在生物特征识别、信息处理、文本分类等领域有
为了解决传统神经网络算法(如BP、RBF算法)中出现的局部极小、收敛速度慢等问题,文献[1]和文献[2]中作者提出了权函数神经网络的概念及其学习算法。权函数神经网络结构简单、