基于内容的视频检索语义提取若干问题研究

被引量 : 0次 | 上传用户:harrydu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频信息分类检索是多媒体研究领域中的重要课题。对海量的非结构化的视频数据如何有效组织、表达、管理、查询和检索,使用户能够快速得到所需要的视频信息,日益成为人们的迫切需要。传统的视频信息检索方案因不能自动、客观、全面地概括视频的内容,已越来越不能满足信息技术发展的需要。20世纪90年代开始的基于内容的视频检索CBVR(Content-based Video Retrieval)的研究,因尚未有效“填平”视频低层特征和高层抽象概念之间存在的“语义鸿沟”(Semantic Gap),使得目前CBVR还难以适用于普通用户。进一步说,目前基于内容的视频检索的语义处理理论和技术仍有大量问题有待深入研究。 由此,本文对基于内容的视频检索语义信息提取过程中的若干问题进行了探讨。总体思路是:首先对视频语义处理理论框架进行设计和分析;然后在此基础上对语义处理技术进行具体研究;进而针对不同的视频内容提出若干语义信息提取的算法;最后设计开发一个基于语义的视频分析检索原型系统。 取得的主要成果及创新点是: 1、为解决“语义鸿沟”这一关键且基础性问题,提出了一个多层次的面向对象的视频语义描述模型,并在此基础上架构了一种基于多种语义来源的语义提取框架,为后续视频语义处理技术的研究提供理论指导。 2、以体育视频为主要研究对象,对基于模式分类的视频语义处理技术进行了研究,主要包括: (1)通过对球类比赛进行主色确定、场地分割,提取场地颜色、纹理、空间比例、运动纹理及摄像机短时运动等特征,在此基础上用ICA和SVM对各种球类运动进行特征优化和分类,取得了较好的效果。 (2)针对足球视频,根据其制作的特点,分别提出了基于图像颜色和空间特征并结合先验知识的镜头分类算法、基于慢镜头制作模式及帧差序列分析的慢镜头检测算法及基于场地线提取分析的禁区场景辨识算法等,进而根据足球视频编辑模式对射门等足球比赛精彩事件进行了辨识,均取得了较好的实验效果。 (3)针对摄像机运动问题,根据运动模式短时一致假设,提出了一种基于视频短时时空切片结构张量分析的摄像机运动定性分析方法,收到较好的效果。 (4)针对WIPE镜头编辑检测问题,从分析数据、结构元定义、能量计算、定位方
其他文献
随着中国经济的快速发展,第三方物流越来越受到重视,竞争也越来越激烈。中国己加入WTO,物流巨头大批涌入,国内传统的运输企业纷纷向第三方物流转型,各种民营第三方物流方兴未
由于复杂体系分离分析的需要,多维联用技术成为近年来国际上研究的热点。其中全二维气相色谱(GC×GC)及其与飞行时间质谱(TOFMS)联用即是新近发展起来的一种高分辨、高灵敏度
自中国改革开放以来,对外开放得到了进一步的深入和扩展,中国的进出口贸易持续不断的高速增长,取得了举世瞩目的成就。繁荣的贸易活动依赖于便捷的交通运输,随着经济的快速增
综合性学习是新课程改革中一个闪光点,体现在语文学科上即综合性言语实践活动。 综合性言语实践活动是以解决问题为目的的语言实践训练,它具有情景性、过程性、综合性和合
本文从题材、创作、音乐、结构、美学等五个方面阐述了普契尼歌剧的特点。 从题材上看,普契尼总是选择三流的文学作品,着眼于渺小的题材,将自己满腔的热情倾注于刻画一些
社会治安对个人、社会都有着切身的影响,有效提供治安服务一直是社会各界关注的问题。本文从公共经济学的角度对社会治安服务问题进行了深入的理论分析,细化了社会治安服务的
南阳汉画研究虽然取得了令人瞩目的成就,但汉画像石、汉画像砖的保护和利用存在保护意识淡薄、收集不够、研究不深入、开发利用单一等问题。保护和利用汉画像石、汉画像砖,政
贫燃料预混燃烧技术可以实现燃气轮机低NO_x排放。但是贫燃料预混燃烧面临燃烧稳定性的主要问题之一是在低、高工况下均易于产生回火。基于煤气化的联产系统中燃气轮机需燃烧
“叙事”本是文学的一种样式,意为告诉、表达、呈现复杂故事。教育的“叙事研究”就是以“叙事”的方式开展的教育研究。叙事研究者相信,人类经验基本上是故事化的,进而,他们
科教兴国,教育是基础。而这其中,农村基础教育在整个国民教育体系中占有举足轻重的地位。大力发展农村教育尤其是农村基础教育是关系到国民整体素质提高的关键问题。当前,在