基于C3D和视觉元素的视频描述

来源 :华南理工大学学报(自然科学版) | 被引量 : 4次 | 上传用户:awander
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,利用卷积神经网络(CNN)提取视频帧特征,再用循环神经网络(RNN)生成句子的方法被广泛用于视频描述任务中.然而,这种直接转换方式忽略了很多视频内在信息,如视频序列的时序信息、运动信息及丰富的视觉元素信息等.为此,文中提出了一种基于自适应帧循环填充法的多模态视频描述(AFCF-MVC)模型;采用自适应特征提取法提取含有丰富时空信息和运动信息的视频C3D特征,使得C3D特征包含了整个视频序列所有帧的信息,并将其作为神经网络的输入;针对不同视频的标注句子长度不同问题,提出了自适应
其他文献
本文通过对荣华二采区10
课堂教学,作为教学的一种基本形式,而且无论是现在,还是将来,课堂都是学校教学的主阵地,数学教学的主要目标都必须在课堂中完成。
本文通过对荣华二采区10
进入21世纪以来,在社会经济稳步发展的背景下,我国电力工程事业发展迅速,而对于电力测量来说,是电力工程中非常重要的一部分,加强电力测量,能够促进电力工程施工的进步及发展。值得注意的是,从现状来看,电力测量主要内容包括定线测量、断面测量以及塔位二度测量等,同时精准定位测量也是关键的内容。本课题重点对电力测量理论及运用现状进行分析,希望以此为电力测量工程事业的发展提供一些具有价值的参考建议。
初中生抽象思维得到一定发展,但对其而言数学依然是抽象性很强的学科,其中蕴含的数学思想繁多,而初中数学教学的目的就是为了培养学生的数学思维,因此在教学中教师要采取多样化教
怎样才能学好语文?这是一个值得深入探讨的问题。作者看来,语文学习可以分为“说、读、抄”这三部曲。
期刊
本文通过对荣华二采区10
1.策略一:蹲下来看孩子、激发学生写作兴趣rn学生习作中的缺点很多,可我们不能一味地批评和指责。毕竟学生不是作家,我们应该明白即使再差的一篇习作,都会有它耀眼的亮点。哪怕是
期刊
以压电驱动器为代表的智能材料驱动器,以其能实现微纳米级精密驱动的优势逐步在精密装备中得以应用,但其内部的回滞非线性在微纳米级驱动性能要求下成为限制精度提升的瓶颈.
在嵌入式电子信息系统运行的过程中,有很多因素都会导致其可靠性下降,进而影响系统的安全使用.面对这样的情况,本文将通过详细分析嵌入式电子信息系统的工作原理,建立起约束