基于内容分析的视频摘要技术及其实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:chendan790914
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展和移动摄像设备的普及,越来越多的人们可以随时随地的拍摄和发布视频,导致了视频大数据的产生。如何高效的在海量视频中定位到想要的信息成为一种挑战。视频摘要技术能够自动的捕捉视频内容中的重要信息和兴趣度高的事件,形成原始视频浓缩版的视频摘要,从而减缓上述问题。算法一般是无监督学习的方法,通过定义目标函数挑选精彩内容,这样会产生大量的复杂计算,效率低下。静态形式的视频摘要往往不能保留视频原有的动作内容和音频信息,导致从中获取的信息不够完整。针对目前已知视频摘要算法中存在的一些问题,本文基于对视频内容的分析,提出了新的解决方法。本文内容主要分为以下三个部分:(1)基于一致性片段生成的动态视频摘要算法。合理的分割视频片段对视频摘要算法有着重要的作用,大多数传统的视频分割方法主要是针对用户编辑过的视频。本算法设计了一种新的片段分割方法,利用片段相似度分数和局部相似度分数,通过剪切-合并-调整三个步骤,将原始视频分割为多个一致性的片段。然后,利用一组特征,算法估计一致性片段内容的重要性,从而产生高质量的视频摘要。(2)基于长短期记忆网络Long Short-Term Memory(LSTM)的动态视频摘要算法。该算法利用监督学习的技术,设计了包含双向LSTM层、多层感知机Multi-Layer Perceptron(MLP)和概率模型Determinantal Point Processes(DPP)的模型结构,能够对视频内容中视频帧的重要性、多样性和逻辑性同时建模,通过对模型进行训练,能够获得效果良好的视频摘要。(3)本文对提出的视频摘要算法进行了设计与实现。该视频摘要演示系统可以由用户选择输入任意一个视频,可以对视频进行播放、暂停播放、跳到指定内容等操作,具有视频摘要功能。
其他文献
与传统的光学通信系统相比,基于轨道角动量模的通信系统显著扩大了无线光通信系统的信道容量。然而,大气湍流将引起光强起伏、光束漂移、光束扩展等现象,导致无线光通信系统
随着社交互动与电子商务受到业界关注程度的提升,社会化电子商务模式已经得到越来越多平台、商家和用户的青睐。伴随Web2.0技术的发展与成熟,用户由被动接受内容模式转变为自
目的:研究应用立体心电图和超声心动图检测阵发性房颤(PAF)患者P波相关参数及左房功能,探究其与射频消融术(RFCA)后房颤(AF)复发的相关性,并行多因素分析探究术后复发其他相关因素,
本文采用Aspen Plus和Aspen Dynamics模拟软件对TDI光气化反应精馏过程进行模拟优化和动态控制方面的研究。又利用反应精馏隔壁塔(RD-DWC)对传统反应精馏(CRD)技术进行进一步的节
结构在使用过程中,节点处于受力复杂而且集中的关键部位。因此,节点对于整体结构安全性极为重要。通过监测手段获取节点刚域有助于建立精确的结构有限元模型,为结构设计验证
磁性固相萃取技术具有操作简便快捷、有机溶剂用量少、磁性吸附剂可循环使用等优点,是富集环境水样中痕量污染物的有效手段之一。磁性吸附剂是磁性固相萃取技术的关键因素。
全钒液流电池(VRFB)由于具有能量转换效率高、循环寿命长、维护简单和环境友好等优点被认为是一种优良的绿色大规模储能技术,可广泛应用于电厂调峰、可再生能源发电及智能电网
在土木工程领域,混凝土耐久性研究一直以来都是一门传统的实验科学。但目前的重大工程中,很多处于硫酸盐侵蚀、氯盐侵蚀、冻融循环、干湿循环等极端严酷环境,使得实验研究难
本文根据脂润滑热弹流润滑理论,以深沟球轴承为研究对象,通过对其在脂润滑下的点接触热弹流润滑分析及有限元分析,对影响轴承工作性能的因素及其疲劳寿命进行了研究,探讨脂润
近年来,随着信息技术的日新月异,多媒体技术正跨入沉浸式(Immersive)时代。全景视频作为重要的沉浸式媒体之一,也迎来了快速发展的阶段。基于用户每个时刻只能观看到全景视频