论文部分内容阅读
随着计算机和网络技术的飞速发展,网上数字视频大量涌现,数字图书馆、视频点播、远程教学等大量多媒体技术已经日益普及。视频信息检索的复杂性远远高于简单的文本信息检索,在这个信息大爆炸的时代,如何对视频信息有效地进行组织和建立索引,从视频媒体库中高效地检索出所需要的视频信息,已经成为目前迫切需要解决的一个问题。本文根据音乐会视频信息的特点,研究了语义视频检索在音乐会视频检索中的应用。为了解决“语义鸿沟”问题,重点研究了音乐会视频语义对象模型以及基于本体的语义注释的检索框架的建立。论文概述了视频检索关键技术,在总结了镜头分割、关键帧提取、视频特征提取和相似度匹配方面的常用算法后,分析了视频的数据结构以及音乐会视频检索的需求,并在此基础上构造了音乐会视频的领域本体以及语义对象模型。针对音乐会视频的特点采用音乐会领域本体来指导语义对象的标注。采用标准web本体描述语言OWL来描述音乐会视频的数据结构,并将查询扩展和正则表达式两种信息检索技术结合在一起,提出了一种基于音乐会木体的语义注释检索框架CVSARM,并提出OSQL查询语言以支持对语义概念以及本体的检索模式,目的是为了辅助大规模视频库的组织与检索,并提高音乐会视频流检索效率以及准确度和查全率。视频检索是高维空间中的计算,提高检索的速度是问题的关键,针对高维空间计算量大的问题,本文引入了奇异值分解(SVD)方法,它能将特征的高维空间转换到低维空间,在低维空间中逐维过滤掉不相关的数据集,从而大大缩小了检索范围,提高了检索效率。为进一步提高语义检索的准确率,使之更满足用户的需求,本文设计了更为友好的用户反馈界面,提出了模糊相关反馈技术来弥补计算机的不足,从而使检索结果更接近语义层次的要求。最后,设计并实现了音乐会视频检索系统的实验原型,完成了镜头分割、静态特征提取、视频检索、相关反馈等模块。分析和测试了该音乐会视频检索系统的准确率与查全率,验证了系统的可行性。