基于内容视频摘要研究与应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:arsonloupeen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息高速发展,视频数据在现代社会中发挥着越来越重要的作用,视频摘要提取技术正是在这种大环境下“应运而生”的。视频摘要提取是从视频数据中摘取具有代表性的图像帧或视频片段,通过视频结构化和摘要提取,能够生成一个有意义的并且能够体现视频内容的结构大纲,便于用户对视频内容进行浏览、编辑和检索。目前,视频摘要在多个方面取得了长足的进步,当前主要研究内容包括:视频底层特征分析、中级语义信息提取(即语义事件检测)、高级事件推理、精彩事件检测、自动摘要生成、视频浏览、视频检索、个性化定制、视频内容编辑等,然而,由于数据模型的适应性、语义的分析和理解等仍存在较大问题,大规模的应用还没实现。本文针对数据模型和语义分析这个热点和难点从视频特征,结合视频类型规则和统计物理学等跨领域内容进行了较系统和循序渐进的研究。   本文主要完成的研究工作有以下几个方面:(1)详细总结了与基于内容的视频摘要相关的理论、系统的发展状况。结合国内外在视频结构化分层领域的研究成果,引出了本文基于内容的视频摘要生成的方法,并阐述了一种层次视频摘要系统框架。(2)利用DirectShow技术,实现了视频的播放与视频帧的捕获,并合并视频摘要形成缩略视频,并探讨了关键帧提取的原理与主要算法,重点介绍互信息量聚类算法,并利用VC++实现了这些算法,同时进行比较分析;(3)本文以基于互信息量聚类算法为基础提取关键帧,并提出“局部-空间”模型,同时以广告和体育视频为例,详细说明该数据模型的实现流程,获取了动态视频摘要;(4)在上述模型的基础之上,参考多重分形、流形学习和张量分析,提出一种高层语义概念形成场景级视频摘要的算法-基于流形学习张量方法的视频摘要研究,并进行了实验对比。
其他文献
启发式搜索是智能规划领域的重要方法之一,其策略核心为启发式函数的拟定。路标是规划任务中成功规划必须实现的子目标,实验证明,基于路标的启发函数能有效引导启发式搜索过程并
数据挖掘能从大量数据中,提取有用的信息。分类是数据挖掘的重要功能之一,在很多领域得到了广泛的应用,如医疗、保险、金融等。不同的分类方法有各自的优点,同时也存在一定的
软件可靠性是衡量软件产品的一个重要指标,对于软件可靠性的研究是评估软件性能、控制软件开发过程、提高软件产品质量的基础,软件可靠性模型在这个过程中起着至关重要的作用。
无线Mesh网络作为下一代无线网络关键技术,得到了人们广泛的关注与迅速发展,如何保证用户业务的服务质量已经成为了无线Mesh网络亟待解决的关键问题之一。本文在分析基于时分多
SDM是移动核心网中用户数据管理系统,是移动核心网的数据中心。网络运行中其它核心网网元需要的用户数据需要向SDM申请。SDM主要功能包括帮助运营商实现对所有与用户相关的数
新视点图像合成是当今计算机视觉和图像处理领域的交叉学科,是虚拟现实技术重要组成部分。基于图像的视点图像合成技术克服了传统的基于3D模型的视图合成算法的不足,具有真实性
P2P流媒体技术凭借其低成本、良好的可扩展性和易部署特性成为大规模视频直播、点播系统的首选解决方案,也迅速成为学术界的研究热点。然而,这一领域也充满挑战:P2P网络是一个
20世纪以来,群智能优化算法作为一种新兴的优化算法,受到优化领域众多研究者的广泛关注。算法通过模拟社会性动物的各种群体行为,利用群体中个体之间的信息交互和合作来实现寻优
软件产品已经应用到社会生活中的各个领域,人们对于软件产品的质量也越来越重视。软件测试作为保障软件产品质量的主要手段,在整个开发周期中所占的比重也越来越大。随着软件
随着我国西部大开发的进行及新疆地区的大发展的实施,维汉机器翻译作为一种快捷方便的沟通工具能够辅助新疆地区经济和社会的和谐发展。然而,目前关于维汉机器翻译的研究较少,本