视频语义信息提取的研究

被引量 : 0次 | 上传用户:heixianshengzhs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和网络的发展,产生了越来越多的视频数据。相比较于传统的文本信息,视频的内容更加丰富、直观和生动。但是视频由于其非结构化和内容的多义性,使得无法对它进行有效的检索。如何对这些视频进行有效地组织,存储,管理和检索,使用户能快速获得所需要的信息,已成为一种迫切的需求。传统的信息检索方案,因其不能自动、客观地概括视频的内容,已越来越不能满足信息技术发展的需要。20世纪90年代初,开始了一种新技术的研究,这就是目前人们普遍关注的基于内容的视频检索技术(CBVR,Content-Based Video Retrieval)[10,11]。早先的视频信息检索方案,是通常人工浏览视频、人工标注信息来实现的。但它不能客观、准确、全面地概括视频的内容。现有的内容检索技术则是基于底层特征的,它将视频序列分割为镜头,并在镜头内选择关键帧,然后提取镜头的运动特征和关键帧中的视觉特征,并存入视频数据库[3]。最后根据用户提交的查询按照一定特征进行视频检索,将检索结果按相似性程度交给用户。这种检索方式是基于底层特征的,非语义层面的。然而,人们更习惯于使用高层概念进行相似性判断。当中存在的低层特征和高层语义之间的“语义鸿沟”问题,使得CBVR还难以适用于普通用户。如何填平“语义鸿沟”,达到语义级别的视频检索,成为最具挑战的研究内容。为实现根据语义查询,本论文针对视频高层语义提取(或视频标注)展开研究,利用支持向量机(SVM)提取视频的语义特征。在当前普遍缺乏训练样本的前提下,将主动学习引入语义提取当中,在人工干预尽量少的情况下,获得更好的结果。然而已有的主动学习算法多采用单模态的方法,即将特征向量串联成一个大维数向量,来进行学习。考虑到视频特征的多样性和复杂性,本文提出一种基于SVM的多模态主动学习算法,在每一轮主动学习中,根据每个模态反馈的样本进行人工标注。每个模态使用SVM学习其概念。通过该方法,更充分地挖掘了人工标注的劳动,避免反馈样本局限于特定区域。本文的主要工作如下:1、首先论述了视频检索的研究背景和研究现状;2、在研究视频检索关键技术的基础上,提出了本文所使用的特征和特征提取的方法;3、针对支持向量机的广泛应用,展开对统计模式和支持向量机原理的研究,并将SVM应用于视频标注。4、在前两步的基础上,针对上面提出的问题,设计了一种基于SVM的多模态主动学习算法,并进行了实验验证。5、最后设计了一个快速检索框架,帮助实现本文的工作。
其他文献
对120例婴幼儿叶酸(FA)、维生素B12、铁缺乏及贫血的发病率及其缺乏程度进行调查分析,结果120例中,FA缺乏、维生素B12缺乏、SF缺乏发病率分别为46.67%、5%、30.83%。贫血发病率为71.67%,无重度贫血。SF缺乏及贫血除发病高峰
目的探讨血管内皮生长因子与sIL-2R在分化型甲状腺癌患者血清中的表达水平及其诊断能力。方法选择2014年2月至2015年12月于我院头颈外科就诊的甲状腺病变患者66例和健康对照3
目的探讨全结肠型先天性巨结肠的诊治方法及预后。方法回顾性分析24例全结肠型先天性巨结肠的临床特征、手术方式、并发症及随访情况。结果本组存活19例(79.2%),死亡5例(20.8%);
筛选出3个优良金银花类型,即大毛花、鸡爪花和山银花,并总结出一套金银花人工丰产栽培技术。
目的探讨球囊扩张术在环咽肌失弛缓症所致吞咽障碍中的治疗作用。方法共选取10例经吞咽X线荧光透视检查诊断为环咽肌失弛缓症的吞咽障碍患者。利用14号导尿管球囊,采用注水方
本文以呼和浩特市回族伊斯兰教音乐为主要研究对象,通过对呼和浩特地区三位较具有影响力的古兰经诵经家黑富海、康明清、金建华的采访,以及对他们念诵古兰经文的音调和赞圣音
针对传统机电设备调试技术调试结果准确率低的问题,提出机电设备自动化调试技术研究。根据机电设备调试要求,采用DW激光传感器采集调试数据,并运用神经网络结构和BP算法对数
受体卵母细胞去核是核移植过程中至关重要的一步,几种去核方法已在核移植技术中得到应用。为了达到完全去核的目的,荧光染料和紫外光被应用在去核方法中,但同时也带给母源胞质负
本文从分析欠发达地区县乡财源不足的原因入手,提出必须加快县乡经济结构调整,大力发展特色经济,巩固传统财源,开拓和培育新兴财源,并且要进一步深化财政体制改革,为解决县乡