基于概念的网络视频检索技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dgwyldgwyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于概念的视频检索技术,经过近十年的研究和发展,已经成为缩小“语义鸿沟”的有效途径,成为基于纯文本视频检索的有效补充。近年来,随着视频分享网站的蓬勃发展,面对内容丰富,标注质量参差不齐的网络视频集,如何实现当前基于概念的视频检索技术从窄域视频集向广域网络视频集的迁移,成为一个重要研究课题。  本文从已有的基于概念的视频检索技术出发,分析了其向网络视频集迁移中遇到的挑战,从语义概念集的构建、视觉语义概念检测和查询映射三个方面,深入展开基于概念的网络视频检索技术研究,取得了如下研究成果:  1.基于网络弱标签的主题概念集构建算法  在语义概念集的构建方面,本文提出了基于网络弱标签的主题概念集构建算法,该算法利用HDP主题模型挖掘网络标签中存在的主题性,以主题为单元构建概念集;并基于主题概念在网络数据集上的标注训练概念检测器,实现视觉底层特征到主题概念的映射,为视频分析和检索服务。一方面,由于每个主题概念表示为原始标签词典上的一个多项式分布,使得主题概念集能在数量精简的同时保持对整个网络标签集的覆盖;另一方面,由于主题概念的标注来自所有相关标签共同作用的结果,从而保证了主题概念能从网络弱标签中获得更鲁棒的标注。在公开网络数据集上的实验验证了本文提出的主题概念集的有效性。  2.基于增强近邻下抽样的SVM聚合算法  在视觉语义概念检测方面,面对大规模不均衡数据集下的学习问题,本文引入基于下抽样的分类器聚合框架,该框架通过下抽样策略,保证训练数据均衡的同时,减少训练数据规模,并通过聚合多个分类器的结果来提高单个分类器的性能。在此基础上,本文提出了基于增强近邻下抽样的SVM聚合算法,通过考虑样本的分类性能和分布,选择与正样本在当前分类器输出空间最近邻的负样本,进一步提高了算法性能。此外,考虑到由于高维视觉特征引入的时间开销,本文提出SVM核距离离线计算策略来提高学习算法的效率。在公开数据集上的实验结果表明,本文提出的算法能兼顾性能和效率,为大规模不均衡数据集下的视觉语义概念检测提供了一个有效解决方案。  3.基于二分图传播的多概念集查询映射算法  在查询映射方面,由于传统的针对窄域视频集设计的专家概念集覆盖面较窄,限制了视频检索的性能。本文引入前文提出的主题概念集,并以此为基础,提出了基于二分图传播的多概念集查询映射算法,有效融合专家概念集和主题概念集。该算法利用二分图对查询与多概念集之间的关系进行建模,通过查询节点在二分图上的传播,挖掘查询与概念、概念集内部以及概念集之间的关联,实现自适应的多概念集查询映射。在公开数据集上的实验结果表明,该算法能自适应地调整查询对不同概念集的依赖程度,实现多概念集之间的互补,提升检索性能。
其他文献
计算机软件技术极大的促进了社会的信息化进程,从个人移动计算到企业云计算,丰富的软件生态为我们的生产生活提供了极大的便利。但是,在提供便利性的同时,计算机软件系统潜在
图像中的文本蕴含丰富的语义信息,这些信息是图像内容描述和场景理解的关键线索,对于图像检索、信息检测、场景分析和智能控制等应用有着巨大价值。同时,智能手机、数码相机等具
视频监控系统中的行人检测与跟踪是计算机视觉领域中一个活跃的研究课题,是进行个体识别、行为分析理解、异常事件检测等技术的基础,在交通、商业、军事和公共安全等领域具有重
该文首先介绍了软件测试的一些基本概念,以求从总体上对面向对象软件测试进行把握.接着该文分析了面向对象软件测试的特点,叙述了类的封装、继承和对象的多态性等特征在测试
心音听诊是诊断心血管疾病的重要手段,由于听诊不能对心音信号进行定量的、系统化的分析,限制了临床诊断的效果.该文给出了基于心音时频分析的心音成分识别方法,设计并实现了
无线传感器网络(Wireless Sensor Network,WSN)以Ad-hoc网络结构或分层结构来对传感器节点进行部署,通过传感器与外界交互完成数据采集、处理以及通信等功能,具有低成本、低功耗
学位
该文致力于实用化ATM用户接入设备的研究设计,完成恒定比特率(CBR)业务的电路仿真功能,为E1业务接入ATM交换网络提供了支持. CBR业务接入ATM网络必须遵循相关协议及电路仿真
随着视频数据的爆炸式增长,传统的基于关键字查询的不足逐渐暴露,基于内容的视频检索技术成为切实可行的提高检索质量的方案。由于视频数据在时间域上存在极大冗余,因此关键帧选
作者首先总结了模糊数学和数据挖掘相结合的各种方法,并着重研究模糊关联规则的数据挖掘的方法,并提出了对布尔型关联规则、数据型关联规则、周期型关联规则模糊化的方法,提