基于深度学习的行为识别技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xqjulia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和多媒体技术的蓬勃发展,视频类媒介方式已经被普遍地应用到人们的生活和工作中。深度学习在计算机视觉领域有巨大的优势,在视频描述、细粒度图像的分类等方面实现的效果是传统方法难以企及的,因此,深度学习技术在行为识别领域的应用成为国内外研究者的热点研究方向。行为识别技术的实质是对视频帧的分类,目前行为识别技术中常用的模型都是基于卷积神经网络实现的,卷积神经网络被成功的应用到了图片分类问题中。在本文中,以3D卷积神经网络为基础,搭建了新型的行为识别模型,能够更加有效地提取视频中的内容和视频运动特性,并且通过借鉴人类视觉注意力机制处理海量信息的方式,将注意力机制引入到模型中,使模型更注重视频中重要的特征信息而忽略冗余信息,最后在行为识别数据集上对模型进行了实验验证和分析。论文主要内容包括:(1)设计了一个时空双流CNN-GRU神经网络架构。针对原始双流架构中使用卷积神经网络提取视频的空间特征和时间特征而导致视频信息利用不足并且无法真正学习视频的时序性特征的问题,论文提出了基于3D卷积神经网络的双流神经网络与GRU(Gated Recurrent Unit)网络相结合建立的更深层次网络的架构。该架构在空间域和时间域上更有效的提取视频的动作信息,让模型更多的表达视频的运动信息和时间特征,并且能更强地表达视频的时序性特征。最后在行为识别数据集UCF101和HMDB51上对本文提出的框架进行实验验证,证明了本文提出的时空双流CNN-GRU神经网络基础架构与同类方法相比,识别率得到了一定的提升。(2)改进了时空双流CNN-GRU神经网络架构的损失函数。针对现有模型难以处理行为识别数据集中存在大量的噪声和异常值问题,论文通过研究信息论中的步长因子与误差信号之间的关系,结合相关熵可以处理非高斯噪声和脉冲噪声的优点,提出自适应双曲正切相关熵损失函数微调算法,从而提高时空双流CNN-GRU神经网络架构在加噪数据集上的鲁棒性。对UCF101数据集进行加噪处理后,实验证明了本文提出的算法在非加噪数据集上与现有领先算法的识别率相差不大,但是在加噪数据集上本文提出的算法的识别率比现有领先算法提高了0.19%,说明本文提出的算法对加噪数据集具有较好的鲁棒性。(3)论文将注意力机制引入到时空双流CNN-GRU神经网络中,该机制对空间流和时间流特征向量进行建模,通过监督的方式将计算得到的Attention分数分配给每个特征向量,代替传统的空间流特征向量和时间流特征向量最大值或者均值融合方式,对空间流特征向量和时间流特征向量进行自适应加权融合。基于监督的特征自适应加权融合方式使模型在训练过程中更加关注重要的特征并且减少模型中的冗余信息。最后在行为识别数据集UCF101和HMDB51上进行了实验,证明了论文提出的基于注意力机制的时空双流CNN-GRU神经网络基础架构的识别率达到领先的水平。
其他文献
文章以高职电子商务专业《Flash动画设计与制作》中”Flash遮罩动画制作“教学单元为例,从课前认知、课堂学做和课后拓展三个阶段进行信息化教学设计,融入了混合式翻转课堂、个
<正>据欧洲汽车制造协会(ACEA)公布的数据显示,2017年第四季度,欧盟地区新能源汽车的需求量继续保持增长,同比增幅达到35.1%,总计售出227378辆,在整个乘用车销量当中的占比达
本文是一篇关于舞蹈培训的交替传译实践报告。笔者在2019年1月~6月在沈阳某舞蹈室进行了关于舞蹈培训的口译实践,主要负责日本老师来中授课期间的口译工作。实践结束之后,笔者总结了其中存在的问题,并进行反思,然后查找了相关资料寻找解决策略,汇总成此报告。本文共分为五章,第一章引言中主要介绍了选题的意义以及研究方向。第二章主要是对实践任务的介绍,包括本次任务的背景、内容、双方发言人的特点等。第三章简述了
电影日,每周一次的电影晚宴  恋爱时你们经常去电影院的吧?那段时光一定在内心里埋下了共同看电影的美好记忆。家里的孩子大了,也可以一家子去电影院或在家里看电影,其乐融融。  好的儿童电影同样是童话,而且是“活的”童话。既然是童话,就该有童话的元素,有坏蛋、无辜的好人、跟儿童匹配的故事节奏,还有让孩子提心吊胆的欢乐结局(而大人们总是觉得毫无悬念),如果你还没有洞察儿童电影中的这一切,那么恭喜你,孩子们
1.广播电视无线发射监控系统概述广播电视无线发射系统是由多种设备组建而成。在广播电视无线发射系统中,发射机是其核心构件。因发射机器械原理及工作环境的特殊性,其故障发生
文化型主题酒店,是以酒店所在地最具影响力的地域特征、文化特质为素材,来进行设计、建造、装饰、提供服务和经营的酒店类型。它在满足空间的居住功能同时,更能为居住者提供独一无二的体验感和愉悦的精神享受。而富有特色的地域文化是主题酒店设计的灵魂所在,如何更好的挖掘和表现特定的地域文化是重中之重。地域文化内涵的主题酒店空间是当前的热点问题,也是未来酒店的发展方向。本文以当下主题酒店的现状及发展入手,进行调查
新媒体环境下,企业与品牌为了满足受众多样化的需求,不断丰富广告的设计形式和传播途径,寻求有效促进产品销售的突破点。其中,漫画以其独特的视觉优势广泛的应用于商业广告创
在飞行器操控中,利用语音表达飞行员的控制操作,可实现更为便捷的控制意图,尤其在多种操作组合联动的争分夺秒的时刻。但座舱内的高强度噪声的存在、机载语音控制指令的选择
目的:观察丹参、黄芪对肝硬化门静脉高压血流动力学及肝纤维化指标的影响。方法:选择84例肝硬化门静脉高压患者,随机分为A(常规治疗)组42例和B(常规加丹参、黄芪治疗)组42例,分别
在中国传统艺术理论中,“意境”一词很早就出现了,它不仅伴随着中国传统艺术的成长,更成为了中国传统艺术根基,工笔花鸟画作为中国传统绘画艺术之一也不例外。两宋时期的工笔