基于内容的多模态视频检索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：nanpingke11

【摘要】

：

近年来,视频内容呈现爆炸式增长态势。随着个人数码摄像设备的普及,存储器容量的提升,以及网络环境的改善,越来越多的人热衷于拍摄自己身边各种有趣的视频,并上传到网上与人

【作者】

：

卢铮

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2008年期

【关键词】

：

视频检索基于内容的检索文本检索概念检测图像分割融合重排序

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,视频内容呈现爆炸式增长态势。随着个人数码摄像设备的普及,存储器容量的提升,以及网络环境的改善,越来越多的人热衷于拍摄自己身边各种有趣的视频,并上传到网上与人分享,同时又在网上搜索并欣赏自己感兴趣的视频。对于电影工作者来说,人工处理海量的视频数据是件相当耗时耗力的事,如何更有效地管理并再利用视频成为了当务之急。在社会安全保障行动中,侦察活动必不可少,如何从侦察机和无人机上拍摄的大量视频中提取有用的信息对整个战局起着至关重要的作用。因此,视频检索在国民经济和社会发展中有重大需求,是当今信息社会亟待解决的基本问题之一。然而,视频检索技术面临着巨大挑战。如今的视频检索引擎(如YouTube.com等)基本沿用了文本检索的方式,且文本仅来自于视频外部人们对视频的文本描述,诸如视频标题、标签等,即把视频当作文档来处理。如何自动从视频内在的语音、字幕、图像序列等信息中提取语义继而进行检索极具挑战和吸引力。与文本检索不同,基于内容的视频检索涉及图像处理、语音识别、信息检索、机器学习、模式识别等多个领域的综合交叉学科。美国国家标准局(NIST)自2003年起组织了视频检索竞赛(称为TRECVID),TRECVID已经成为比较视频检索算法性能的全球公共平台,每年吸引了全球众多研究团队的参与。本项研究工作就是在微软亚洲研究院与上海交通大学联合参加TRECVID2007的背景下开展的,并在最后的检索任务中取得了第一名的成绩。本文重点阐述在如下三方面中的研究成果。首先,在基于文本的视频检索中,一方面提出了对从视频中提取出的语音文本实行根据视频语言种类采取不同的文本组合策略,克服了固定文本组合数太小时不能充分利用上下文信息即视频内容在时序上的连贯性而引起的查全率降低,以及组合数太大时不相关的结果被误检索出来而引起的查准率降低的问题。另一方面,改进了在传统文本检索中有良好表现的BM25公式。考虑到传统文本检索时,查询词在文档中被检索到就表明该词出现在该文档中;而在视频检索中,同样出现在语音文本中不同词性的词,在视频画面中体现出来的概率是不同的。因此本文提出在BM25公式中根据词性引入了关键词的权重,使其更好地应用于基于文本的视频检索中。其次,在对基于文本和基于概念检测的检索结果进行融合时,根据视频特点,提出了一种根据查询分类的线性融合,即根据不同类别的查询,对不同模态的检索结果分配一定的权重来进行融合。该方法有不逊于非线性融合的准确率,且易于实现,计算量小,运算速度快,可用于实时系统。考虑到正确的返回结果在视觉上存在一定的一致性,本文提出利用K-means聚类算法对融合后的结果进行重排序,进一步提高了整个视频检索系统的检索效果。最后,在基于概念检测的视频检索中,本文所采用的概念检测方法与如今普遍被采用的方法相同,都是图像级的,即用来预测的低层特征都是全局性的。当图像较为复杂、包含概念较多时,概念间的特征会互相影响,降低了检测精度。本文在最后提出了基于图像分割的概念检测设想,利用已有的图像分割算法,通过大量分割结果,分析、探讨了基于图像分割的概念检测方法,提出了概念检测中基于细致分割的不可行性及基于粗略区域划分的可行性,为今后进一步的研究工作确立了方向。

其他文献

三节点中继网络中的无线通信技术研究

随着人们对通信需求的不断增长，移动通信技术获得了快速的发展，涌现山了一批以MIMO、OFDM为代表性的先进技术。它们被认为是新一代移动通信系统的核心技术。然而，移动终端由于受

学位

无线通信丢包率中继网络中继协议

我国城市土地管理中的问题及对策

摘要：本文对我国快速城市化进程中城市土地管理存在的不足进行了分析，并探讨了相应的解决对策。　　关键词：土地管理；问题；对策　　中图分类号： F301.2 文献标识码： A 文章编号：　　城市不仅要建设，而且要管理。在走向2020年“全面小康社会”的发展过程中，我们面对城镇化加速的重大挑战，政府如何转变职能、更充分提供公共产品、促进社会和谐等已经成为社会普遍关注的焦点，城市规划、环境改造、征地拆迁以

期刊

命名数据网络身份隐私保护研究

随着互联网技术的迅速发展，内容流量的飞速增长以及用户需求的不断提高，使得当前基于TCP/IP的网络架构面临着带宽消耗、安全性和大规模内容传输需求等问题。为了从根本上解决这

学位

命名数据网络数据包双向匿名性身份隐私保护

基于GPRS的车辆监控系统中心端研究

本文开篇首先介绍了车辆监控系统目前的发展现状和未来发展趋势,之后从系统设计的角度描述了车辆监控系统中心监控端的各个功能模块,并进一步提出系统中心端前台软件各个组成

学位

车辆监控系统中心监控端通用分组无线服务技术设计理论

建筑节能与新材料研究

中图分类号：TE08 文献标识码：A 文章编号：　　一：关于建筑节能材料：　　节能建筑材料作为节能建筑的重要物质基础，是建筑节能的根本途径。在建筑中使用各种节能建材，一方面可提高建筑物的隔热保温效果，降低采暖空调能源损耗；另一方面又可以极大地改善建筑使用者的生活、工作环境。　　走环保节能建材之路，大力开发和利用各种高品质的节能建材，是节約能源，降低能耗，保护生态环境的迫切要求，同时又对实现我国2

期刊

功图预测算法的研究及在油气生产中的应用

近年来，油田生产在众多方面协调发展，在油田最为重要的产量计量环节和实时监控方面，需要高度自动化，实时性强，精确性大的系统。由于硬件设备价格较贵，安装成本较高，同时又有数字化油

学位

示功图最小二乘支持向量机预测算法油气生产图像处理

整车操稳试验路面洒水方案研究

[摘要]针对汽车操纵稳定性测试路面的喷水系统，提出几种方案进行讨论研究。关键词：操稳试验，循环利用，水膜厚度，自动化控制　　中图分类号：C33 文献标识码：A 文章编号：　　　　1操稳试验基本情况　　随着汽车产业的飞速发展, 汽车驾驶的安全性越来越受到重视，再加上政府对各汽车公司研发基地及试车场建设的要求，因此各种路况、车况下试验测试种类更加多样化. 汽车操纵稳定性试验是整车性能试验中极其重要的

期刊

基于博弈论的LTE优化与设计

通信技术的快速发展、无线频谱的日益紧张和用户对通信系统的业务能力的要求使运营商需要对无线网络进行融合部署。在异构网络联合覆盖的条件下,用户对不同无线网络接入的选

学位

LTE优化博弈论负载均衡仿真分析移动通信

基于双核处理器的DMR终端基带模块硬件设计与调试

随着无线电通信技术的发展、人们对无线通信质量要求的提高以及频谱资源的日益缺乏,传统的模拟对讲机已经不能满足需求,对讲机的数字化已经成为一种趋势。搭建一个数字对讲机

学位

DMR双核处理器OMAP5910

基于遗传聚类算法的图像基元识别

计算机图像处理是一门伴随着计算技术的高度发展而新兴起的学科。其目的之一是在计算机上实现和强化人的视觉以及人对视觉信息的加工和处理能力。将简单的模式图形如三角形、

学位

遗传聚类算法图像基元识别图像处理图像分析全局最优解遗传算法

基于内容的多模态视频检索

与本文相关的学术论文