论文部分内容阅读
基于视频的人体动作识别已经成为了计算机视觉邻域备受关注的前沿方向之一,其在智能视频监控、高级人机交互、体育性能分析、基于内容的视频检索等许多领域均有着广泛的应用。尤其是从一个单目摄像机中能够实现对任意视角下的人体动作进行正确的识别是一个非常有意义的工作。但是目前的研究普遍存在人体动作特征表示鲁棒性不强、动作建模参数空间复杂度高、动作模型缺乏视角空间转换信息等问题,使得视角约束问题已经成为基于视频的人体动作识别发展和应用的瓶颈问题。本文针对现有的视角无关动作识别算法存在的以上三个问题进行了深入研究:首先,针对人体动作特征表示算法视角鲁棒性不强的问题,本文对传统的兴趣点词袋表示进行改进,提出了一种基于兴趣点视频段词袋直方图与分区域光流幅度直方图相结合的特征,该特征对于一定的摄像机视角变化具有鲁棒性,且特征提取简单,抗干扰能力强,能够充分的表达人体的运动信息;其次,针对动作建模参数空间复杂度高的问题,本文采用参数空间分解的思想,提出了一种基于视角空间切分的多视角空间概率融合隐马尔科夫模型识别算法,该算法通过分别在各子视角空间下建立人体动作模型并通过概率融合进行识别的方式,有效的降低了模型参数空间的复杂度,提高了动作识别的准确度。最后,针对人体动作模型缺乏视角空间转换信息的问题,本文在多视角空间隐马尔科夫模型基础上,提出了一种基于多视角空间状态转换的隐马尔科夫模型识别算法,该算法通过在多视角空间引入状态转换概率,有效的加强了各子视角空间下的动作模型之间的视角转换约束关系,使得算法对于视角变化问题的识别性能得到有效提升。