基于卷积神经网络的人体动作识别研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:woxiangtoucai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别作为计算机视觉领域的一个研究热点与难点,一直被广大的研究者学者所青睐。传统的人体动作识别方法虽然准确率尚可接受,但需要手工设计并提取动作特征,故其受个人差异的影响较大。而卷积神经网络能够自动的将低层特征提取到高层特征,完全不受人为因素的干扰,并且在图像识别领域取得了突破性的进展。因此,本文的目的是基于卷积神经网络提出识别率更高、鲁棒性更好的人体动作识别方法。本文首先对目前基于二维卷积神经网络的LRCN算法进行了深入研究,发现LRCN在特征提取方面使用的是较浅层次的AlexNet卷积网络,导致无法提取更加有效的、语义更加丰富的特征,而使用的记忆神经LSTM单元存在结构冗余,参数较多等问题,使得模型运行时间较长并且较易发生过拟合的现象。针对上述问题,本文提出了一种改进的LRCN算法,使用了较深层次的ResNet-34网络替换了AlexNet网络,同时使用GRU单元替换LSTM单元,并通过实验对比了改进后的LRCN算法模型不仅提高了人体动作识别率,也在一定程度上缩短了模型的运行速度。虽然LRCN相比于卷积神经网络增加时序学习,但是LRCN算法却无法对空间特征与时间特征进行同步学习。因此,本文又对能够同步学习两种特征的3D卷积神经网络的人体动作识别算法进行了深入研究。然而3D卷积神经网络虽然能够同步学习空间与时间上的特征,但是该算法模型只采用了两层线性卷积层,因此其模型抽象能力不强,无法提取更加抽象的特征。基于此,本文基于3D卷积神经网络重新设计了一种人体动作识别的网络,相比于原网络,新网络不仅增加了两层MLP卷积层,还使用了dropout技术防止网络产生过拟合并且减少了参数计算,最后使用GAP去替换了最后的全连接层。因此,新的网络具有更强的抽象能力,以及更好的鲁棒性。最后本文为了验证新网络所具有的优势,在UCF101公共数据集进行了同步对比。通过实验证明,相比于原网络,新网络在人体动作识别准确率方面表现更加优秀。
其他文献
目前存储是IT领域中发展最为迅速的热点之一.究其原因,主要有两个方面:1、应用需求的牵引.数字化地球对巨量信息的有效存储提出了迫切的要求:
在民用飞机产品的设计阶段考虑产品的可维修性,利用JACK软件对机务维修任务进行虚拟仿真以及对维修的舒适性、可达性、可视性进行人机工效评估,验证产品的可维修性并提出改进
加强企业党风廉政建设,提升央企管理质量,则必须重视加强企业廉政文化建设,明确党建标准化工作,促进标准化理念与党风建设的有机结合;落实"八项精神",培养廉洁的党员队伍。本
民间美术属于传统文化中浓墨重彩的一笔。本文阐述了民间美术和审美意象的定义和特点,通过文化背景、创作精髓、构图布局、造型意象以及色彩特征几个方面着重探讨了民间美术
目的研究生姜根、番石榴叶、番石榴籽、橙皮、芝麻种皮、米糠和小麦胚芽等植物提取物的抗氧化活性和热稳定性。方法比较了乙醇、乙酸乙酯、三氯甲烷、正己烷和石油醚等不同溶
1 案例1.1 简要案情某年12月22日,陆某,女,55岁,因故倒地后,胸部先后被邢某、杨某骑坐并踩踏。伤后21 d,公安机关法医学鉴定意见为“陆某所受损伤程度为轻伤一级”。邢某、杨
详细介绍影响公路路基路面压实效果的主要因素,如含水率、碾压设备的型号与碾压方式等,分析公路工程路基路面压实施工技术的施工要点。
在基于视觉的人机交互中,利用人体动作是非常有效的方法。然而动作是一个复杂的三维信号,在复杂的场景下高效稳定的识别人体动作仍然存在很多问题。针对人体动作识别问题,本文分别从视频序列、人体骨架序列以及二者的融合中提取动作时空特征,利用卷积神经网络识别分类。根据项目需求,本文研究内容主要分为以下几个部分:基于视频流的双通道卷积神经网络动作识别算法。针对现有的双通道卷积神经网络由于计算稠密光流速度缓慢的问
以邻氯苄腈为原料 ,经格氏反应得 4′-甲基 - 2 -氰基联苯 ,溴化后同 L-缬氨酸苄酯对甲苯磺酸盐反应 ,酰化 ,催化氢解 ,用 Na N3/Zn Cl2 叠氮化环合得到最终产物
在当前网站易用性研究成果基础上,分析网站易用性定量测度中存在的问题;针对网站易用性直接定量测度难题,阐述信息距离基本理论厦测度方法,以此为基础首次建立直接定量测度模型,即