论文部分内容阅读
基于视频的人体动作识别是计算机视觉领域一个备受关注的研究课题,近些年来,人体动作识别研究取得了较大的发展,已经有越来越多的成果应用于现实生活中,如智能监控、人机交互、虚拟现实等。针对传统人体运动信息的表征大多以背景剪除、目标跟踪为前提、容易受动态背景噪声、光照变化、阴影、遮挡等干扰的问题,本文采用3-D Harris时空角点与3-D HOG局部时空特征描述子相结合的方法来表征视频中人体动作运动特性,实现了不同人体动作的分类识别。3-D Harris角点能够给出视频数据紧凑的表达以及对时空事件进行准确的定位,3-D HOG时空描述子能够对人体动作的运动信息进行全方位表征。通过词袋模型,为每个动作视频建立了表征人体动作的词频直方图。本文采用K均值聚类算法为词袋模型生成视觉单词,针对经典K均值聚类算法中聚类结果会随着初始聚类中心不同而不同的问题,提出了一种改进初始聚类中心选择的方法。对于具体样本集合,以初始聚类中心之间距离最大化为原则,设定一个符合样本之间距离的合适阈值T,在满足所有初始聚类中心两两之间距离大于T的条件下,进行迭代聚类。实验表明,改进算法的聚类结果能够反映真实的类别差异,并且更加稳定。本文采用k近邻分类器和支持向量机两种分类方法对提取的人体动作特征进行分类,并比较了两种分类器的分类性能。本文在Weizmann和KTH两种视频库上进行仿真实验,对于Weizmann视频库,采用了留一交叉验证方法,由于KTH视频库样本视频数量较大,采用了K交叉验证方法。实验结果表明,本文提出的人体动作识别方法能够得到较好的识别率。