基于时空信息和深度学习的视频总结和标题生成

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:tianyemin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着摄像机和智能手机的普及,在网上出现了爆炸式指数增长的视频,这些大量无组织的网上视频内容无疑会降低用户的体验度。因为要想查看相关视频并抓住视频内容里面的主旨是要消耗很多时间并且乏味的,所以我们迫切需要提供一个高效且符合用户的方法去组织和浏览这些大量的视频数据。我们引进了视频总结和标题生成的方法来满足上面的需求。我们的框架包括两部分:一个基于深度卷积神经网络(CNN)的编码网络和一个基于注意力机制的长短时间记忆神经网络(LSTM)作为解码网络。在编码网络中,我们首先提取关键帧来表示整个视频内容,然后将关键帧输入到编码网络提取视频特征。在解码网络中,我们引进能避免梯度消失的LSTM网络产生描述视频内容的语义性句子。视频内容总结是产生一个即对用户感兴趣又具有代表性的压缩版视频,视频内容总结可以分为:关键帧(由一系列具有代表性的图片组成)和片段(由一系列具有代表性的片段组成)。一个好的视频总结至少具有两个特性:1)包括视频中最感兴趣的部分,2)保持多样性去除冗余度。为了完成视频总结,我们首先利用视频的显著线索和动作线索得到稳定的显著权重和动作差别权重,然后用我们提出的选择模型提取满足用户的关键信息。我们提出一个独特的框架,结合这些权重预测每一帧的重要程度,重要的帧作为关键帧。我们的方法不需要通过训练来学习重要标准且能够预测之前未看过的视频。最近基于注意力机制的编码-解码框架的视频标题生成已经取得进展。然而还存在诸多问题:1)许多已经存在的解码方法,只考虑视频序列的动态时间注意力信息到自然语言过程的建模,而忽略视频内容和句子语义信息之间的关系。为了强调这个问题,我们提出了一个基于时间注意力机制的LSTM模型并结合语义一致性方法(aLSTMs)进行视频标题生成。2)已存在的解码方法,产生每一个单词,包括视觉单词(像“gun”,“shooting”)和非视觉单词(像“the”,“a”)结合注意力机制来关注最相关的视觉信息。然而这些非视觉单词能够很简单的结合自然语言模型就能预测出来。非视觉单词结合注意力机制可能误导或者降低整个视频标题生成的效果。为了强调这个问题,我们提出了一个结合可调节时间注意力机制的级联LSTM(hLSTMat)进行视频标题生成。这个框架利用时间注意力机制去选择特定帧预测相关单词,可调节时间注意力机制决定关注视觉信息还是自然语言信息。级联LSTM同时考虑低层次的视觉信息和高层次的语言信息来帮助我们的视频标题生成。为了证明上述我们提到的方法有效性,我们在MSVD和MSR-VTT两个数据集上做实验,结果显示,我们的方法取得了最好的效果。
其他文献
目的:探讨达比加群与利伐沙班在非瓣膜性心房颤动(NVAF)患者中抗凝治疗的疗效和安全性。方法:计算机检索PubMed、Embase、The Cochrane Library及中文数据库获得有关NVAF患者
通过对素质教育的本质、课堂教育的目的、教师在课堂教学中所起到的作用三个方面的论述,阐明了课堂是实施素质教育的主阵地;从更新教育观念、深化教育改革的角度,论述了实现
<正>在现代企业的公司治理中,董事会是公司治理的核心,它是集体决定公司业务执行意思的机构,称职的董事会是传递公司具有强有力的竞争优势的信号,它可以确保公司领导权的连续
苏曼殊一生充满着浓厚的悲剧性和传奇色彩,他内心世界总处于失衡状态,经常"无端狂笑无端哭"。苏曼殊性格的复杂性与矛盾性是和其身世、成长经历、中西文化的冲击及受制于"世
包括屠呦呦、韩非子以及“一带一路”、青岛大虾宰客事件等在内的考题,出现在江苏省高级人民法院政治部近日组织的2015年第三批聘用制书记员公开招录考试笔试试卷中。来自全
报纸
<正>新密市劳动保障监察大队针对来电来访投诉拖欠的案件,采取"快"办结化解"慢"矛盾措施,坚持快立案、快调查、快办理、快结案的"四快"原则,迅速找准劳资双方的纠纷切入点,进
离心机是化工行业乃至整个工业上非常重要的一种分离设备。本课题根据国防科技基础产品创新计划项目的要求,对离心机的离心脱水过程进行三维动态仿真。本文在深入了解离心机
<正>日前,江苏省人社厅颁布《江苏省劳动保障监察维权绿色通道管理办法》,自2011年12月起全省劳动保障监察机构维权绿色通道全面开通,对劳动保障监察执法维权过程中涉及的各
本文介绍了小儿脑性瘫痪语言障碍的原因、特征、检查与评价、康复训练、康复效果。
采用两步熔融缩聚法(预聚合和后固化),分别使木糖醇与癸二酸、木糖醇与辛二酸聚合,制备了聚癸二酸木糖醇酯(PXS)生物弹性体和聚辛二酸木糖醇酯(PXO)生物弹性体。为进一步提高