论文部分内容阅读
人体动作识别是目前计算机视觉研究的一个热点,也是一项极具挑战性的工作。人体动作识别技术可以在诸多领域中发挥重要作用,如:高级人机交互、智能视频监控、3D电影电视和动画、基于姿态的互动游戏等。本文重点致力于解决在视频场景中对人体动作进行识别的问题。在总结目前对视频中的人体动作识别相关研究的基础上,将人体动作识别分为人体动作表示以及人体动作分类这两个主要步骤。本文接着采用特征包模型和视频分片相结合的方法进行人体动作识别。即首先利用角点检测等方法确定人体动作的感兴趣点,接下来对感兴趣点周围的立方块进行分析,计算该立方体的描述子。对于每个视频,提取相同数目的感兴趣点并计算其描述子。然后建立特征包模型,通过聚类算法计算出特征包词典,然后利用特征包的分布来描述整个视频。同时,利用视频分片将原始视频分割为若干个视频片段,并用视频片段的人体动作类别对原始视频所表示的人体动作进行标注。本文提出了基于感兴趣点位置信息的人体动作识别方法。采用了Harris-OF人体动作感兴趣点检测方法并提出了Ho P描述子。即首先利用Harris角点检测视频中的感兴趣点并用光流法去除无效的感兴趣点,然后处理得到的Harris-OF感兴趣点的位置信息得到该视频中感兴趣点位置分布的Ho P描述子,并将其作为该视频的描述。并采用SVM和NN分类器进行分类。基于Ho P的方法不需要对感兴趣点周围的小块进行计算,同时也不用进行特征包方法中的聚类处理,因此其速度远远快于现有算法。在进行人体动作分类时,为了解决内存不足以及训练样本数较少的问题,本文采用视频分片方法进行分类。同时本文针对现有视频分片存在的不足提出了视频的智能分片算法。实验表明,采用合理的视频分片不仅可以有效增加训练样本的数目,而且可以在很大程度上提高人体动作识别的准确率。本文首先在Weizmann人体动作数据集中使用基于特征包的人体动作识别方法,达到了较高的准确率。基于Ho P的人体动作识别方法在Weizmann,KTH以及复杂场景下的You Tube数据集上均能在快速识别出人体动作的同时保持较高的准确率,对于实时性要求较高的场合有很好的应用价值。