基于深度信息编码的人体动作识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:siaonn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的快速发展和人们生活水平的提高,人们对于生活的智能化也越来越关注。人体动作识别在智能监控系统、智能机器人、人机交互、动作分析等领域有着广泛的应用前景。人体动作识别是计算机视觉领域的一个具有挑战性的科研任务,涉及了图像处理、神经网络、机器学习等多门学科。然而由于背景复杂、相机运动、衣服的不同、以及遮挡等问题的存在,导致人体动作识别很难实现。目前人体动作识别领域还处于研究阶段,而且用于研究的数据库背景相对单一、视频数量有限、视频中大多都是只有一个主体,人体动作识别距离实际应用还有不少的路要走。针对当前人体动作识别提出的方案大多输入固定、计算量大、时间复杂度高、没有有效的利用运动信息和时空信息等问题,本文在深度学习的基础上结合光流、空间金字塔池化(Spatial Pyramid Pool,SPP)、卷积特征编码、线性轨迹等对人体动作识别进行了深入研究。本文主要做了以下三部分工作:1.提出了一种基于光流和SPP-ConvNets的人体动作识别方法。本算法利用光流法进行区域分割获取视频和光流的运动区域,然后利用加入了SPP层的卷积神经网络SPP-ConvNets对获取的运动区域进行分类识别。本方法不仅使输入图像为任意大小,减小了因截取和拉伸等造成的图像失真,而且将静态信息和运动信息融合来提高人体动作识别的识别率和算法的鲁棒性。2.提出了一种基于Two-stream网络和局部深层特征编码的人体动作识别方法。本方法首先将视频和对应光流分别经过Two-stream网络学习获取卷积特征,对获取的卷积特征利用局部深层特征编码获取局部深层特征描述子,局部深层特征编码保留了卷积层包含的空间信息并增加了特征描述子数量可以提高人体动作识别的准确度。然后对获取的局部深层特征描述子进行降维白化处理并利用K-means聚类,分别用VLAD向量表示每段视频和光流。最后合并视频和对应光流的VLAD向量作为SVM分类器的输入数据进行仿真实验。3.提出了一种基于空间线性池化编码的人体动作识别方法。利用空间线性池化编码对视频和光流获取的卷积特征进行编码获得线性特征描述子,同样对获取的局部深层特征描述子进行降维白化处理并利用K-means聚类,合并视频和光流的VLAD向量作为最终的人体动作识别的特征数据。空间线性池化编码在静态信息和动作信息的基础上融入了线性轨迹信息,更深入地挖掘了视频中的连续多帧之间的运动轨迹信息,提高了人体动作识别精度,并且本算法计算简单,特征量小。
其他文献
分子识别作为超分子化学的核心内容之一,已经被广泛应用于生命科学、食品安全、信息传递和环境监测等领域。在目前分子识别的许多方法当中,荧光探针检测由于具备操作简便、成
为满足不断提升的市场需求,3GPP等国际标准化组织积极推动着无线通信系统标准化进程。异构部署是3GPPLTE(Long Term Evolution)及LTE-A(LTE-Advanced)标准化的重要研究内容之
研究目的是希望帮助马来西亚中医界了解温病方药在马来西亚的运用现状,分析温病方在马来西亚的运用规律及其治疗的病证。同时也希望通过这次的论文更加了解中医学在马来西亚的历史进程和当前马来西亚中医临床现状以及温病方在马来西亚的运用文献理论研究。目前,马来西亚中医温病方使用现状的调研属于空白区,之前尚未有人进行过,故本研究具有一定开拓性。本文分为两个部分,第一部分为概述。通过这个部分阐述了中医学如何传入马来
3GPP在其发布的版本12中提出小小区的网络架构,以应对未来无线流量的爆炸性增长。小小区是一种低能耗、低费用的小型基站,主要应用场景是室内和室外的热点地区。由于部署简单
多糖水凝胶由于生物相容性优良而被广泛应用于药物传递系统。但是水凝胶载体在体内循环时也会遭受蛋白吸附污染和非特异性免疫排斥。因此,需要融合两性离子聚合物的抗蛋白特性,开发一种无污染的两性离子多糖水凝胶。已有研究证实两性磺基甜菜碱(SB)和羧基甜菜碱(CB)具有显著的防污性能。然而,很少有研究关注SB和CB材料之间的差异,尤其是两性多糖。本文中,我们设计了两种两性离子葡聚糖水凝胶:磺基甜菜碱葡聚糖(S
近年来随着数字多媒体技术和网络通讯技术的迅猛发展,数字图像已经成为人类传递信息的主要载体之一,与此同时,图像在教育技术领域的重要性也日渐突出。随着数字图像信息数据
学位
本文运用制度变迁理论、农户经济行为理论、交易成本理论等理论构建本研究的理论基础;然后对调研所获得的260份农户数据进行描述统计分析的基础之上,构建了二元Logistic模型
【目的】核糖核酸(RNA)N6-甲基腺苷(N6-methyladenosine,m6A)修饰是一种动态可逆的过程,由甲基转移酶样蛋白3(methyltransferase like protein 3,METTL3),甲基转移酶样蛋白14(methyltransferase like protein 14,METTL14)和肾母细胞瘤1相关蛋白(Wilm’s tumor 1-associated
作为一种动态的程序分析技术,动态符号执行凭借高代码覆盖率、自动化计算输入值、分析结果准确等优点,已被广泛应用于软件测试和验证领域。路径搜索是动态符号执行过程中的核