基于卷积神经网络的人体动作识别研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:afdwer213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术与计算机智能监控技术的发展,大量的视频数据应运而生。针对视频中特定目标的分析,传统的人工分析方法已经不能满足现有的需求,因此智能的处理视频数据成为一个关键问题。在当前行为识别算法中,卷积神经网络作为深度学习的代表算法,具有表征学习的能力,在目标检测与识别、自然语言处理等领域相比传统的计算机视觉技术和专家系统有更好的性能表现。本文主要针对UCF101数据集,重点研究基于卷积神经网络的人体动作识别,具体内容有以下几个方面:1.改进3D卷积神经网络模型。在C3D模型的基础上,借鉴谷歌Inception系列网络思想,使用多个小卷积核代替大卷积核增加模型的非线性表达能力。在输入数据上,使用多种数据的不同组合训练改进后的3D网络,通过分析不同组的实验结果,确定最优的输入数据格式。改进后的3D网络其准确率相比原论文中提升了3.3%到达了88.5%,复杂度降低了33.6%。2.提出基于时间维度的注意力机制动作识别模型。将时间注意力机制添加到改进后的3D卷积模型上。首先在特征提取模块的最后,使用金字塔池化层更加全面的考虑多层卷积的特征。其次在池化层后增加基于时间维度特征的注意力网络,将池化后得出的特征加入到时间注意力网络中,对视频帧中的特征增加相关性权重,并通过注意力机制的迭代更新特征的权重。改进后的网络模型准确率为90.4%,证明了这种改进的有效性。3.设计双速帧率特征检测模型。参考快慢结合思想,将其融合到3D卷积网络中,设计双速帧率检测模型。模型分别使用不同的帧率来获取视频中的空间语义信息和运动信息,两通道信息通过侧向连接的方式进行特征融合。在获取所有特征后,将特征输入到时序检测网络,识别时序动作,并为网络模型设计行为识别系统,证明网络模型的可应用性。本文主要通过改进网络结构提升网络的表现性能,并实验验证网络中做出的改进。在最后设计简单的网络系统,证明网络的可应用性。
其他文献
自在之物是独立于人的意识之外的客观世界,是还没有被认识的自然世界;为我之物是已被认识了的自在之物,是自在之物的必然结果。自在之美是尚未为主观世界认识的美,为我之美是已被
目的:探讨PDCA法在社区慢性心力衰竭患者监测中的应用效果。方法选择社区99例慢性心力衰竭患者随机分为观察组和对照组,观察组采用PDCA法,对照组采用一般方法。观察1年内观察组
在谈话类节目中,语言对于主持人来说不仅是一种交际工具,更是主持人必须掌握的一门艺术。谈话类节目主持人作为沟通节目与观众的中介,他(她)与被访问者之间的谈话不仅是两个
增强型体外反搏(EECP)是一种非侵入性、成本低,且安全有效的冠状动脉粥样硬化性心脏病(冠心病)治疗措施,然而其确切的疗效机制至今仍未得到充分的阐明。以往认为,血流动力学效应
初中生不良行为的产生有家庭、学校、社会及主观等因素,应对的策略应从与家长经常沟通,加强对学生的思想品德和行为习惯的教育,加强心理辅导等方面入手。
简要介绍了南京第一高楼紫峰大厦核心筒施工平台的设计及优化,对各种工况下的施工平台受力采用有限元软件进行了分析,并根据分析结果进行了优化,取得了很好的效果。
研究摄影艺术性是极复杂的工作,任何一个摄影者和艺术家只要适时地按下快门,就能相当精确地复制出被摄对象,这就形成了长期以来艺术理论中把摄影看作是简单的、消极的、不易
<正>居住在大小兴安岭地区的鄂伦春族,是我国人口较少而同样有着悠久历史的兄弟民族之一。关于鄂伦春族的历史起源和演进过程,由于史料的匮乏,至今在学术上还不是已经很清楚
打破传统的审美观念,摆脱传统意义的美,努力创造一种新的审美形式和绘画方式已经成为西方艺术运动的最终目的。在世纪之交的西方现代艺术在从本质上改变了传统艺术的发展的同时