基于两阶段稀疏优化协同的视频摘要

来源 :中国科学院大学(中国科学院西安光学精密机械研究所) | 被引量 : 1次 | 上传用户:taobixianshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着电子数码产品的迅速普及,消费类视频数据正在以一个迅猛的速度不断增长。采用人工观看的方式处理这些视频数据将会是一项低效且耗时的工作。因此,在视频检索、智能存储和交互式浏览等诸多智能视频管理系统中,自动获取视频数据的主要信息是一个亟需解决的问题。视频摘要技术通过选取涵盖原视频主要内容的关键帧满足了上述需求,从而提高了人们快速准确获取视频信息的能力。相比于已有的许多视频摘要方法所针对的新闻、体育赛事等有人工编辑的结构化视频数据,消费类视频由于没有预先设定的拍摄内容,以及不存在人工编辑的视频结构,使得基于消费类视频的视频摘要工作更具有挑战性。针对这一难题,本文提出了基于两阶段稀疏优化协同的视频摘要方法。在第一阶段,通过稀疏表达的重构误差选取涵盖原视频主要信息的视频帧,组成候选关键帧集合。许多现有的方法致力于通过字典学习模型挑选出具有代表性的视频帧。然而,如果不对原数据空间中样本间的关系加以考虑,将导致不准确的表达。为解决这一问题,在本文提出的算法中,通过基于图的学习策略将邻近帧间的几何分布信息整合进字典学习的过程。接下来,在第二阶段,我们从第一阶段得到的候选关键帧集合中选取代表原视频内容多样性的视频帧。考虑到视频由多样性内容构成,候选关键帧集合可以依据视觉内容的不相似度区分成不同的子集合。因此,对于给定的候选关键帧集合视频帧成对间的不相似度,本文通过基于不相似度的稀疏子集选择来寻求各个不相似内容视频帧子集合的代表帧。第二阶段选取出的代表帧即为最终形成的视频摘要。本文旨在通过以上两阶段稀疏优化,使形成的视频摘要不仅涵盖原视频主要内容,同时避免冗余信息,保持原视频的多样性内容。为了验证本文提出视频摘要方法的有效性,本文在三个视频数据库上进行了验证。通过与其它主流的视频摘要方法进行实验对比,结果表明,本文提出的方法具有良好的鲁棒性和有效性。
其他文献
目前虚拟现实是受关注最多的高新技术之一,而分布式仿真一直是虚拟现实领域的研究热点。随着虚拟现实系统的规模不断扩大和逼真度要求逐步提高,将分布式仿真技术、视景仿真技
近年来互联网发展速度一日千里,变化日新月异。电脑、手机的迅速普及和功能的强劲使得人们在足不出户的情况下就能通过互联网了解国内外资讯、查看新闻、关注娱乐时尚、获取
根据计算,到2020年中国国际移动通信频谱需求总量将达到1350~1810 MHz。截止到2014年底,中国为国际移动通信系统规划的频率总计达到687 MHz,还存在至少663 MHz的需求缺口。因
近年来外国投资者对中国的并购投资项目数量增长,并购金额逐年增加,我国已经成为世界主要国家投资的目标市场。但是针对大量的外资并购项目,我国没有专门的外资并购国家安全
集成学习是机器学习领域中首要热门方向。它是通过某种方式组合多个学习器解决同一问题并且能够显著提升整个学习系统的泛化性能。集成学习由最初的萌芽经过众多相关领域的研
在陆地无线通信系统中,由于各种障碍物、散射体以及传播路径上其他发射源的存在,传输信号可能会发生比较严重的畸变。受多径效应、高斯白噪声、同信道干扰及其他因素的影响,
随着无线通信的发展,协作通信扮演着越来越重要的角色,中继技术在协作通信研究中的地位更是举足轻重,为了克服中继技术中的同步问题,半双工中继就变得更受欢迎。最近提出的互
当今城市发展密集化、高层化,城市轨道的发展因其环保、效率高快速进入人们的生活。地铁施工环境比较复杂、技术要求越来越高,隧道施工过程是十分重要的。在减弱盾构机对接触土体的扰动方面、控制地表沉降这两个两方面,在工程的应用有很实际的参考作用。本文以合肥地铁一号线三期工程物-天区间为研究对象,研究隧道盾构施工的整个过程对地表沉降和预测变化趋势的影响。通过对数据的处理、Peck公式的推导和使用的FLAC 3
网络的飞速发展给人们生活带来了便利,与此同时,引发的信息爆炸让人们很难精确的定位所求的信息。由于自然语言的歧义性,对实体的语义进行消歧成了搜索的关键问题,而针对语义
背景癌症是威胁全球人类生命的最大杀手之一,是当前医学研究领域所面临的一个重大挑战。目前,提高肿瘤治疗过程中的有效性及准确性已成为突破当前肿瘤治疗瓶颈的关键问题。纳米科学的发展,为发展新型多功能纳米抗癌药物提供了可能。利用纳米材料作为药物载体或将活性纳米材料直接作为药物,可以提高药物的吸收利用率,实现高效靶向药物递送,延长药物消耗半衰期,并减少对正常组织的副作用,从而提高肿瘤治疗的有效性和准确性。乳