基于深度学习的人体动作识别方法研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:senkooqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代生产生活中非接触人机交互已经成为一种不可忽视的交互方式,尤其在当前疫情条件下,更突显了它的重要性。对人体动作进行视觉信息采集、识别、分类是这种交互方式的重要实现方法。其中基于人体骨骼点进行动作识别是一种高效的识别方式。本文对基于人体骨骼点的动作识别中的噪声问题进行了相关研究:主要包括对骨骼点模型中大量存在的噪声进行了捕获和分析,对人体动作进行预测以此克服动作缺帧,并且在现有的双流CNN网络基础上进行模型改进,增强其对噪声的抑制能力。针对骨骼点序列数据中的噪声提取问题,本文选取数据集中静物被误匹配为人体数据作为包含帧间噪声的样本,对样本做完去中心化处理后用分布统计方法和曲线拟合方法估计出噪声模型。针对帧间动作未匹配产生的部分动作缺失问题,本文通过动作数据的连贯性进行丢失帧预测,使用双向LSTM网络作为编码端,使用单层的LSTM网络作为解码端,构成编解码的预测网络。双向LSTM赋予网络时序上的双向连贯性更加利于网络提取时序特征。对比实验的结果证明应用该方法预测人体动作的误差始终小于多层LSTM网络。针对帧间噪声问题,本文在双流CNN的基础上加入残差收缩网络,根据软阈值对中心噪声抑制的特性,在光流信号端加入了软阈值去噪机制和通道注意力机制。通过引入去噪机制,该方法在现有网络的基础上提高了网络对人体动作识别的准确率,并通过多个数据集进行验证。本文基于深度学习的方法,有针对性地对人体动作信息中的噪声处理进行探究,在预估的噪声模型基础上进行了相关的加噪实验,以此验证该方法在不同噪声环境下的表现。实验说明了基于双向LSTM搭建的编解码结构在处理帧间信息的缺失问题时要优于多层LSTM,利用该方法可以有效缓解缺帧产生的对后续识别网络的影响。在对双流CNN进行改进后引入软阈值机制和通道注意力机制构成一种能够抑制噪声的特征提取网络。通过在NTU-RGB+D数据集中使用交叉视角进行验证,该方法将识别准确率提高到89.8%;使用交叉对象验证方法,该方法将识别准确率提高到84.7%;而在SBU Kinect数据集中该方法将识别准确率提高到95.9%。本文提出的方法降低了人体骨骼点动作识别中的缺帧影响和帧间噪声影响,提高了识别的准确率和有效性。
其他文献
齿轮作为旋转设备的核心零件,自身结构和运行环境较为复杂,因此在运行过程中经常出现磨损甚至断裂的状况,致使整个机械设备发生故障。不仅经济上遭受损失,严重时会威胁人身安全。因此,齿轮的故障诊断具有重要的实际意义。声发射技术是从材料缺陷本身发出的动能来检测的方法,并且对故障敏感度高,可以实时检测,因此将声发射技术应用在故障诊断领域受到越来越多的关注。故障诊断中,机械系统运转背景噪声会对声发射信号产生干扰
学位
报纸
随着现代工业技术的发展,铁磁性材料广泛应用于能源运输领域,石油、天然气的运输主要依靠铁磁性管道。管道经过长时间使用后,由于外界环境的变化和运输介质的腐蚀等极易影响其机械强度和使用寿命,一旦发生事故会造成严重后果,因此定期对管道进行无损检测对其安全运行具有重要意义。管道漏磁内检测技术作为一种对铁磁性管道无损检测的方法,具有适用性强、可检测类型多、自动化程度高等优点,得到了广泛应用。管道缺陷的几何尺寸
学位
随着大规模集成电路的迅速发展,芯片制程的不断成熟,集成电路晶体管技术已经充斥了生活中的各个领域,成为当今社会进步不可或缺的一部分。为了实现更高的器件灵活性和更简便的技术实现,需要尽可能地提高集成电路的每一个器件的功能。可重构晶体管进入了人们的视野,可重构晶体管一般有两种导通机制,分别是肖特基势垒带带隧穿导通机制与MOSFET导通机制,这造成了晶体管输出特性差的问题。本文提出了一种高集成的双肖特基势
学位
天然透明质酸稳定性差、易降解,故需对其进行改性以提升性能,如硫酸化。硫酸化透明质酸是透明质酸的硫酸化衍生物,因其独特、显著的生物活性,如抗炎、抗肿瘤、抗凝血、调节细胞因子活性等,在伤口愈合、生物涂层、医药等方面均展现出优异的应用前景。现根据国内外研究进展,对硫酸化透明质酸的合成、生物活性,及其在伤口敷料、组织支架、治疗性药物等方面的现有和潜在应用进行综述,同时对其未来发展进行展望。
期刊
<正>对于站桩,时间、质量非常重要,但最重要的是看有没有"站进去"。什么是"站进去"呢?这个词好像是一个暗语,凡是曾站"进去"过的人,都明白什么意思,无需解释。凡是没有站"进去"的人,又怎么都形容不清楚。有一个最简单的标志,就是眼珠不瞬,眼皮不眨,眼神自然的长时间凝定不动。古人把人体的运动分为外动和内动,四肢百骸的运转移动为外动,而内部气血、内分泌、微循环,这些运动则是内动。只有在心神凝定的时候,
期刊
高超声速飞行器在军事国防和民用中都具有重要意义。高速飞行的机体与空气的剧烈摩擦会产生强烈的高温,如果隔热复合材料与机体表面的粘接有缺陷,则会有很大的安全隐患。平面电容层析成像(Electrical Capacitance Tomography,ECT)技术可以通过图像重建的方式实现对复合材料粘接缺陷的可视化检测,但存在着重建图像中伪迹较多、缺陷不够清晰的问题,容易产生误判和漏判。本文针对此问题研究
学位
信息技术的日益成熟离不开微电子技术的不断发展。集成电路作为微电子技术的内核,必须继续朝着低成本、高性能的目标努力,同时还要克服摩尔定律中因尺寸不断缩小而带来的短沟道效应和迁移率降低等问题。如今,集成电路技术已经渗透到我们生活的全方位。由此本文提出了一种具有非易失性浮动可编程门的可重构场效应晶体管(FPG-RFET)。与传统具有编程栅的RFET可重构晶体管不同,新器件引入了非易失性电荷存储层作为浮动
学位
集半导体工艺和传统机械制造技术优势于一身的微机电系统(MEMS),凭借其结构简单可靠、集成度高、易于批量生产等特点及优异的半导体特性,已成为取代传统机械结构的最佳选择,电容式硅基MEMS微加速度传感器就是应用这种技术的典型成果之一。目前主流的电容式加速度传感器广泛采用各种悬臂梁结构,通过控制质量块的位移改变极板间距或者接触面积引起电容变化,由外部检测电路读取电容从而实现加速度测量功能。但这种结构普
学位
低压差线性稳压器(LDO)具有结构简单、输出电压稳定、纹波小等优点,成为电子芯片产品重要的组成部分。无片外电容LDO作为供电电源使用时,当负载发生突变时,会导致输出电压产生很大的波动,其pf级的负载电容也会严重降低系统环路的稳定性。此外,传统稳压器提供的输出电流较小,高性能处理器和通信模块需要大输出电流的线性稳压器。基于此种情况,设计了一种瞬态增强大输出电流无容LDO芯片电路,在大输出电流时提高环
学位