论文部分内容阅读
人体动作识别是行为理解的基础,有着重要的研究意义和广阔的应用前景。人体动作识别一般包括几个关键步骤,即运动目标检测、时空特征提取、动作分类识别。本文首先介绍了几种运动目标检测的常用算法,包括高斯混合模型法,ViBe算法,光流法等。然后本文主要使用了两种模型进行人体动作识别,第一种是基于3D Zernike矩的人体动作整体特征的分类识别,这是一种基于时空特征提取的方法。该方法中将人体动作视作是一个由人体剪影组成的时空形状,计算该时空形状的3D Zernike矩作为人体动作视频的整体特征,然后使用支持向量机的分类方法对其进行分类识别。第二种是基于稀疏表示方法的人体动作识别,这种方法不同于传统的时空特征提取方法,它是将原始数据转换到另外一个空间进行表示。本文基于稀疏表示使用了两个不同的算法进行了实验验证。第一个算法是先将每一帧的视频数据进行分块,并在此基础上得到每一帧视频数据的稀疏系数,这些系数是对原始数据的一种简洁的表示,然后对这些系数使用相似度比较的方法进行分类识别;第二个算法是基于SRC(基于稀疏表示的分类方法,Sparse Representation based Classification)方法的,本文在SRC方法基础上做了一些额外的处理与改动,使其更加适合于视频数据的分类,该方法中首先根据SRC方法的思想,将训练数据的所有帧作为过完备字典,使用该字典对测试视频的各帧进行稀疏表示,然后对得到的稀疏表示系数,使用类似于运动能量图像的思想进行叠加得到对应于整个测试视频的特征,然后依据该特征进行分类。最终的实验结果表明,第一个算法,将稀疏表示作为特征提取的方法效果不够理想,还有待于进一步地改进和完善,第二个算法的实验结果好于一些传统的基于时空特征提取的方法。