论文部分内容阅读
人体行为识别是对包含人体运动的图像序列进行运动目标的检测和跟踪,并在此基础上利用人体动作过程视觉模式的动态变化特征对特定动作进行建模和识别。人体行为识别是当前计算机视觉和模式识别领域的研究热点,并在视频监控、数字娱乐、人机交互等具有广阔应用前景。本文对人体行为识别方法进行了相关研究,主要研究内容包括:1)运动目标检测和跟踪:通过背景建模和背景差法实现了运动目标检测,在此基础上,采用均值飘移算法实现了运动目标跟踪,从而实现了运动目标所在时空区域提取,作为后续人体行为识别对象;2)图像特征提取:主要研究的视觉特征包括多尺度多方向盖伯特征组(Gist)、形状上下文特征(Shape Context)、视觉关键词直方图(Bagof Words,缩写:BoW),从而实现了对人体动作特征的视觉描述;3)动作建模:主要研究了能够挖掘时间序列潜在结构化特性的三类随机场模型(条件随机场、隐条件随机场和潜层动态条件随机场)的构建、学习和推断,并基于各模型实现了人体动作的建模和性能分析。本文的实验是用Matlab仿真实现的,利用当前领域里流行的人体动作识别公共数据库(Weizmann数据库和KTH数据库)对所研究视觉特征及时序模型性能进行了验证。实验结果表明:所采用图像特征能够表征人体结构和形状视觉特性,并且随机场模型有利于挖掘动作序列的内在结构特性实现动作序列建模和推断,因此所构建动作模型能够有效实现人体多类动作识别;由进一步对比实验和分析可知,因为隐状态的引入,使得隐条件随机场对非结构化的动作序列数据建模具有更高的灵活性,因此先对于条件随机场和潜层动态条件随机场具有更好的时间序列分类性能。