论文部分内容阅读
人体行为识别由于其广泛的应用前景以及潜在的社会、经济价值,已经成为计算机视觉领域中备受关注的前沿方向之一,吸引了国内外众多研究人员投入其中进行深入地研究并取得了大量的研究成果,然而视频特征提取计算复杂度与行为识别准确率之间的矛盾仍未得到有效解决。人体的行为过程是一个随时间连续变化的动态过程,并且具有一定的周期性,由此得到的数据流所产生的观测序列在不同时刻具备一定程度上的相似性,单层学习模型无法对观测序列在时间粗粒度上的这种相似性进行有效地描述;层次学习模型能够获得较好的高层抽象特征表达,但是建模过程复杂度高。本文在总结和分析目前国内外常用人体行为识别方法的基础上,针对上述问题做了如下工作:1.总结了目前国内外常用的运动目标检测方法,分析了各种运动目标检测方法的优缺点,提出一种新的特征提取方法:1)利用混合高斯模型对原始输入视频进行建模,提取出运动目标的前景二值图像并求取前景二值图像的质心坐标;2)以质心坐标为中心在该前景二值图像对应的原始视频帧图像上定位前景块,采用3层金字塔结构提取前景块的金字塔方向梯度直方图(Pyramid of Histograms of Orientation Gradients,PHOG)特征作为该帧图像的特征向量;3)整段视频做同样处理后,得到原始视频所对应的时序性观测序列。本文特征提取方法显著减少了背景的边缘信息对图像特征表达造成的干扰。2.采用层次序列总结隐条件随机场(Hierarchical Sequence Summarization Hidden Conditional Random Field,HSSHCRF)模型对时序性观测序列进行建模,通过层次序列总结的方式来捕获时序性观测序列中复杂的时空动态信息,即通过交替进行序列学习和序列总结,动态且递归地建立一个层次结构。就序列学习而言,使用隐条件随机场(Hidden Conditional Random Field,HCRF)模型学习潜在的时空动态信息;序列总结就是把隐状态空间中具有相似语义信息的观测值归为一组。对于层次结构中的每一层,通过非线性门函数来学习特征的抽象表达,重复这个过程可以获得观测序列经过层次学习总结的高层抽象表达,有效保留底层变量组细节的同时也提高了高层变量组的判别能力,并且通过一种高效的学习方法进行模型训练,模型的时间复杂度随着层次结构的增加仅呈亚线性增长。在经典的行为识别视频数据库上进行本文行为识别方法的验证,同时对实验结果进行了分析和对比,从实验结果可以看出本文有效地缓解了视频特征提取计算复杂度与行为识别准确率之间的矛盾。