数字视频语义概念检测技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：wangxiaoxiao880523

【摘要】

：

多年来，数字视频相关技术取得了飞速的进步，有力地推动着广电、通信和互联网行业中交互点播、视频搜索等相关应用的发展。为了有效管理和利用海量的数字视频资源，需要对视频内容

【作者】

：

陶焜

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2009年期

【关键词】

：

视频语义概念特征选择局部分类器上下文关联映射数字视频

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多年来，数字视频相关技术取得了飞速的进步，有力地推动着广电、通信和互联网行业中交互点播、视频搜索等相关应用的发展。为了有效管理和利用海量的数字视频资源，需要对视频内容进行分析，自动检测并标注视频中包含的语义概念，从而实现符合人类理解和使用习惯的数字视频内容语义描述。　　传统的基于统计模式识别的视频内容分析方法在视频语义概念检测的研究方面取得了诸多可喜进展。然而由于视频语义概念自身的抽象性和样本类型的多样性，跨越数字内容和抽象概念之间“语义鸿沟”的探索依然是任重道远。本文针对视频语义概念检测中的几个关键问题：视频特征提取、特征选择、分类算法以及上下文关联映射算法进行了深入的研究，取得了如下研究成果：　　 1、基于压缩域的视频运动特征提取算法　　传统视频运动特征所承载的信息量与相应的计算代价之间存在着矛盾，并严重制约了其在视频语义概念检测中的应用。为此，本文提出了一种基于压缩域的快速的运动特征提取算法。首先对视频码流中的运动矢量和直流分量进行有效的预处理，修正了一些在编码过程中形成的偏差，并滤除了噪声数据。随后，对一种基于运动矢量的摄像机运动定性分类算法进行拓展，使之可用于摄像机运动参数的快速计算。最后，在宏块尺度上进行前景区域的分割，通过考察其在连续帧中的变化情况得到视频镜头的运动特征描述。实验表明，该特征可有效用于视频语义概念的检测，特别是能显著改善事件/行为类概念的检测结果。　　 2、基于局部可分性分析的特征选择算法　　特征选择算法可以通过计算可分性判据考察不同特征的有效性，为视频语义概念的检测服务。但是，传统的可分性判据难以处理视频应用中的大规模高维连续特征。为此，本文提出一种基于局部可分性分析(LSA)的特征选择算法。本算法首先考察样本在特征空间中的局部可分性，然后基于各个子区域的局部可分性计算全局的可分性度量判据。由于保证了可分性判据计算过程中观测尺度的合理性，LSA判据可以对复杂样本分布情况下的特征可分性进行合理的评估。同时，在利用LSA判据进行特征降维时，采用一种启发式的搜索策略，保证了计算的效率。　　 3、多近邻局部分类器判别融合的分类算法　　视频语义概念自身的抽象性和样本类型的多样性导致了样本在特征空间中的分散性，给相应的建模和分类带来很大困难。为了解决上述问题，本文引入局部分类器算法进行视频语义概念的检测，并取得了如下研究成果：首先提出一种样本均衡聚类算法，可对特征子区域进行合理的可重叠的分割；随后，通过优选采用高斯朴素贝叶斯方法训练局部分类模型；最后，提出一种多近邻局部分类器判别融合的分类算法，通过综合考察多个相邻子区域中分类器的预测值，得到更鲁棒的概念检测结果。相关视频数据集上的实验证明了此算法的有效性。　　 4、基于子区域上下文的多模态多概念检测模型　　利用不同概念之间的相关性进行上下文关联映射，可以有效帮助抽象概念或不显著概念的检测。但视频语义概念存在着样本类型多样性的特点，使得不同概念之间的关联模式非常复杂。本文将样本在特征空间中的分布视作一种隐含因子，并将其用于上下文关系的建模，提出一种基于子区域上下文的多模态多概念检测模型，可以实现对概念间复杂关联模式的有效分析和利用。本模型综合考察了样本的局部相关性和全局相关性，并将上下文关联映射算法嵌入局部分类器算法之中。实验表明，采用本模型可以提高上下文关联映射算法的有效性和泛化能力。

其他文献

高速可重构复接器的设计和实现

为了适应空间技术的发展,空间数据系统国际顾问委员会(CCSDS)针对复杂航天任务的数据传输需求,提出了一种具有高灵活性的数据处理系统——高级在轨系统。高级在轨系统把有效

学位

CCSDSAOS虚拟信道可重构FPGA

智能信息检索技术在分布式数据库中的研究与实现

随着传统的数据库技术日趋成熟、计算机网络技术飞速发展、应用范围不断扩大，在许多领域出现了分布式数据库系统。如何为分布式数据库提供一个高效、灵活、准确地检索系统成为

学位

智能信息检索网络技术分布式数据库

基于KNN分类的单点信号灯控制

道路与道路相交的部位称为交叉口，道路交叉口把各条道路联结起来，形成网络。由于相交道路上的各种车辆和行人均须汇集于交叉口，才能转向其他的道路，这时车辆和车辆之间、车辆和横

学位

数据挖掘信号配时KNN分类信号灯控制道路交叉口自动控制

宽带无线网络中的下行带宽分配算法研究与实现

随着移动用户的快速增长和新业务类型的不断涌现，传统的无线传输技术已经无法满足用户对高带宽和多业务的需求。在这种背景下，能够提供更高数据速率并支持多种业务的宽带无线网

学位

宽带无线网络带宽分配数据调度调制编码选择下行调度模块设计媒体访问控制

电子资源分布式存储子系统的设计与实现

数字图书馆向读者提供了各类电子资源服务。近年来，随着数字图书馆的快速发展，各类电子资源的数量也在快速增加，而传统的电子资源系统多是单机系统，处于“各自为政”的状态，存储扩

学位

数字图书馆分布式存储电子资源

钻井模拟系统数据平台设计与优化

ORACLE数据库已经广泛地应用在各行业，成为国内外高端数据库市场的主流产品和企事业信息化系统的重要支柱。随着企业数据库数据量的增长，将不可避免地出现信息管理软件性能的下

学位

钻井模拟系统性能优化数据库设计SQL数据平台

协同物流商务信息平台的研究与开发

随着企业的不断发展，信息化程度的不断提高，业务流程的不断细化，出现了跨企业、跨行业的业务合作，但物流问题作为阻碍企业业务发展的一大瓶颈，一直是国内外众多学者研究的对象，并且

学位

电子商务协同物流商务.NET软件开发信息交互平台

3-RPC并联机构的动力学性能指标分析与仿真

本课题针对两个少自由度并联机构进行了运动学性能和动力学性能方面的实例分析,这两个机构分别为:平面三自由度并联对称机构3RPC;具有四角平台的3-RPC机构。在具体研究每一个

学位

并联机构少自由度虚设机构法影响系数动力学性能

基于MapObjects的城市公交线网数据管理与分析

随着城市的迅猛发展，城市公交问题已备受各国政府关注。以美国、日本为代表的各发达国家已经逐渐从主要依靠扩大路网规模来解决日益增长的交通需求，转移到广泛利用信息技术来建

学位

公交线网数据资源地理信息系统交通管理信息技术

基于混沌的动态图软件水印算法研究

随着计算机技术和因特网的迅猛发展,软件的盗版与破解却日益严重,因此如何有效解决软件产品的版权保护、防止盗版,已成为软件安全急需解决的问题。目前的软件版权保护技术主

学位

软件水印动态图水印中国剩余定理混沌理论

数字视频语义概念检测技术研究

与本文相关的学术论文