基于子空间分析的多视角视频摘要技术研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户：zhanglq

【摘要】

：

随着数字多媒体技术、网络通信技术和数字电视技术的迅猛发展,视频数据每天都在以井喷的方式涌现。同时,近些年视频监控的普及、体育赛事和娱乐节目等的爆炸式增长,多视角视

【作者】

：

杨峰

【机构】

：

重庆理工大学

【出处】

：

重庆理工大学

【发表日期】

：

2016年期

【关键词】

：

视频摘要多视角视频子空间跨视角特征映射

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数字多媒体技术、网络通信技术和数字电视技术的迅猛发展,视频数据每天都在以井喷的方式涌现。同时,近些年视频监控的普及、体育赛事和娱乐节目等的爆炸式增长,多视角视频已逐步成为视频家族中的一种主要类型。多视角视频数据是指由多个摄像机在不同位置以不同的角度对同一事件在相同时间段内拍摄获得的视频。因其非结构化的数据形式使得对其处理和浏览的效率低下,不能满足实际应用发展的需要。目前,如何对海量的多视角视频数据做高效的分析、管理、存储、传输是研究人员亟待解决的问题。视频摘要技术是指通过自动或着半自动的方式,对视频数据的内容和结构进行分析,并分析提取视频数据中有代表性的视频段。通过对多视角视频合理应用摘要技术能够有效的去除多视角视频的冗余数据,从而解决其存储、传输和管理等方面的问题、提高视频检索和浏览的效率、特别对于公安安防、公共交通、公共娱乐、体育赛事等领域有重要的意义。该论文借鉴现有的单视频摘要方法思路,通过对多视角视频的结果特征进行分析,结合跨视角视频应用中广泛采用的线性空间假设,即相同场景目标在多视角中存在于同一线性子空间的假设,论文首次提出基于子空间分析的多视角视频摘要生成算法。该论文从基于子空间分析的视频预处理研究、基于子空间映射的跨视角特征超空间构建和多视角视频摘要的生成三个方面展开深入的研究,其具体的研究内容如下所示:(1)研究多视角视频预处理方法。分析多视角视频的结构信息,通过基于场景变换检测的视频分割方法,对多视角视频分割为不同场景的视频段;研究基于低秩稀疏子空间更新的视频前景分割方法,对不同场景的视频段提取帧的前景图像;提取SIFT和光流特征,并融合SIFT特征和光流特征为视频的底层特征信息。(2)研究跨视角超空间的构造方法。通过对获得的各视角场景视频段特征,做主成分分析获取各个场景视频段投影矩阵,构建各视角场景视频段的基空间;分析各场景子空间中个元素之间的关系,通过子空间中各元素相互投影,构建跨视角特征超空间。(3)研究跨视角超空间下的基于稀疏子空间的视频内容聚类方法。对构建的跨视角的特征超空间聚类分析,在每类中选择合适的视频段作为代表性的场景视频段,按照各个视频段的时间信息生成多视角的视频摘要。通过在多视角视频公开数据集上进行测试实验,该论文提出的基于子空间分析的多视角视频摘要方法能够从多个视角的视频中有效选取代表视频段,所生成的视频摘要包含了原视频中的关键事件信息,同时摘要视频长度仅为原视频长度的11%。论文提出的基于子空间分析的多视角视频摘要方法为多视角视频摘要技术提供了一种新的理论方法,也为多视角视频的有效开发利用提供了一种有效技术手段。

其他文献

基于项目反应理论的计算机自适应考试系统的研究

近年来,项目反应理论是心理与教育测量非常活跃的研究领域,正迅速成为主要的测量理论之一。项目反应理论是在批评经典测量理论的局限性的基础上发展起来的,随着统计方法的完

学位

计算机自适应考试项目反应理论题库认知诊断

二维经验模式分解及改进方法在图像处理中的应用

经验模式分解是近年来提出的一种新的信号处理方法,是一种完全由数据本身驱动、自适应的分解过程,不依赖于预先设定的基函数,故能对非平稳非线性信号进行有效的分析。它的自

学位

经验模式分解图像处理径向基函数边缘检测图像去噪

基于神经网络的自适应无线域网入侵检测系统研究

随着无线局域网的快速发展,它自身存在的安全性问题,也慢慢的引起了人们的关注。入侵检测系统作为信息安全的重要组成部分,已经成为当前网络安全领域的研究热点。尽管有线网

学位

无线局域网入侵检测神经网络信息安全

基于Web的英汉双向未登录词翻译方法研究

随着信息技术的发展,层出不穷的新词、术语不断涌现,基于词典的翻译已越来越不能满足跨语言信息检索性能的要求,未登录词(Out Of Vocabulary, OOV)翻译已成为跨语言信息检索

学位

未登录词翻译PAT-Tree支持向量机Ranking SVM

基于多层开发架构下的工作流引擎在协同软件中的设计与实现

企业为了解决业务管理中出现的各种问题,提高盈利能力,都先后实施了各式各样的业务系统。为了实现各个业务系统之间的业务数据交换,越来越多的企业希望把所有业务系统集中在一起形成一个协同软件平台。企业管理者通过这个平台就能够了解到企业的所有信息,包括人事信息和财务信息等。各个业务系统也可以通过该平台实现信息共享和交换。企业作为一个有机的整体,是一个协同的系统,有效的协同决定了企业的经营效率、达成目标的能力

学位

工作流工作流引擎协同软件协同企业

基于SOA的招生辅助系统的设计与实现

随着高校数字化校园建设的提出和信息化管理工作的推进,各高校已经通过各种信息化的手段来改变传统的工作方式,引进或开发了符合本校管理的信息化产品,如:教务管理系统、学生

学位

招生辅助系统SOAESBStruts数据库连接池

Spiking神经网络研究及其在图像检索中的应用

作为目前具有最高仿生性的人工神经网络,Spiking神经网络是模拟生物大脑功能而提出的一种新型人工神经网络模型,也被称为第三代神经网络。该模型采用Spike时间编码的方式来表

学位

Spiking神经网络卷积神经网络边缘检测角点检测图像检索

基于uC/OS-Ⅱ和LPC2134的售货机控制系统(VMC)的设计与实现

由于售货机的功能不断增多,售货机控制系统也相应得不断变得庞大,这就使原来的面向过程的开发方法变得越来难以扩展和维护,本文根据自动售货机的需求,在研究了嵌入式开发的基

学位

自动售货机状态机控制系统开发模式

最大可解线性网络编码的计算复杂性与构造方法

网络编码是一个的新研究领域,主要是为了充分利用网络容量来改善传输速率。传统的网络传输方式只允许中间节点(如路由器)转发收到的消息,而网络编码则允许中间节点对收到的信

学位

网络编码最大可解计算复杂性构造

基于手机令牌的身份认证系统的研究与实现

随着网络和信息技术的不断发展,人们比以往更加依靠网络和信息系统解决生活中和工作中的问题,众多的网络及信息系统也面临着比以往更多更具危险性的威胁,身份认证作为信息系

学位

身份认证口令认证手机令牌

基于子空间分析的多视角视频摘要技术研究

与本文相关的学术论文