基于kinect的人体连续动作识别研究

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:heshang9994
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉领域中,人体动作识别是一个重要的研究方向。早在20世纪60年代就有心理学家研究人体行为动作,并确立了通过运动轨迹识别人体动作的理论基础。多年以来,传统的人体动作识别技术在识别效率、成本、环境约束等一个或多个方面的缺陷使得这项技术的应用相对受限,复杂的动作间间隔、时空差异性问题更是导致连续动作识别任务异常困难。随着Kinect等低成本深度相机的出现,近年来越来越多的研究者意识到,深度图像以及骨架信息能够改变动作识别领域这些尴尬的应用现状。然而,目前许多这方面的研究都是基于已分割好或是手动标记的动作序列,对于无标记的连续动作序列识别的研究仍旧较少。本文为研究正确率更高的连续动作识别算法,从动作识别算法以及连续动作分割两个方向出发,分别研究了基于深度与关节数据的特征分类方法以及基于滑动窗的分割算法,以达到最终连续动作识别的目的。其中研究的主要工作贡献如下:1)研究了一种基于深度特征以及骨骼关节点特征联合信息的人体动作识别算法。为了平衡连续动作的识别准确率与算法复杂度,采用了一种基于混联结构的识别算法。该算法先将两种基于低复杂度特征的弱多分类器并联,然后将并联结构与一个强二分类器串联,最后构成一个具有较低复杂度的强多分类器,实现高准确率、较低复杂度的动作识别。单个动作识别的实验中显示该算法相比单独的弱分类器识别准确率明显提升。2)混联结构中,强二分类器对连续动作识别的准确率具有非常大的影响,因此基于条件概率准则研究了一种数据挖掘算法,通过筛选对识别任务无益的关节点,将所有使得两种判别的条件概率近似的关节点剔除,最终达到提升识别正确率、降低模型复杂度的目的。3)研究并验证了一种基于支持向量机(SVM)分类置信度的动作分割识别方案。结合多分类器投票策略与二分类SVM中函数间隔能够预测分类正确度的原理,设计了一种SVM多分类器的分类置信度计算方法。在此基础上,使用滑动窗寻找峰值并最终获得动作起始点以及识别的动作类别。最后在实验部分,基于MSR Action 3D通用动作数据集对算法进行了测试与分析,验证了算法的正确性和有效性。
其他文献
由于人力劳动成本的上升和对生产效率要求的提高,增加制造或测试系统中的自动化环节成为工业发展的一个趋势,越来越多的企业利用智能机械装置对工业设备中的硬件或软件进行自
线性阵列合成孔径雷达(Linear array SAR,LASAR)又称阵列三维SAR,它通过运动平台搭载阵列天线,合成出一个虚拟二维阵面从而获取阵面内的分辨率,并结合距离压缩最终获取三维场
多目标跟踪是现代武器和防御系统中的关键技术,在国防和民用领域都有着重要的应用价值。由于受目标观测信息和目标数目的不确定性、强杂波或杂波强度未知等因素的影响使得多目
随着第四代移动通信技术的发展和应用,MIMO技术已经成为当代无线通信系统的关键技术。在现有MIMO技术已经非常成熟的情况下,下一代移动通信技术的研究,依赖于更加优秀的宽带MIMO
随着医学的发展,人们逐渐意识到作为我们生命基础的细胞是我们身体健康的重要检测依据。因此,基于细胞图像分析方法开始成为了医生进行临床诊断、病理分析和治疗的重要辅助工具
为应对新兴通信业务快速发展带来的挑战,3GPP在LTE之后推出了LTE-Advanced (LTE-A)。LTE-A在LTE的基础上采用了包括增强型多输入多输出(MIMO),载波聚合等在内的更多先进技术,实
极化合成孔径雷达(POLSAR)系统具有多通道、多参数的特点,通过发射和接收目标的不同极化信号,测量目标的全极化散射信息并获得相应的目标特征,为极化SAR图像分类提供数据支持
云计算是目前IT领域最为热门的技术,而云存储更是云计算的核心。云存储在云计算搭建的物理设施之上要对庞大的数据进行有效并且可靠的存储和梳理,硬件之上的软机制便是本文针对
LDPC码作为迄今为止性能最好的纠错码之一,目前已经被许多数字通信标准所采用。随机译码算法是一种最新提出的迭代译码算法,与LDPC译码通常所采用的最小和算法相比具有更低的译
在雷达自动目标识别(ATR)领域中,由于高分辨率一维距离像(HRRP)包含距离像上诸如几何尺寸和散射等信息,且信号易于获取及处理,因而获得该领域内越来越多的关注。自香农开创了