论文部分内容阅读
人体行为识别是指利用计算机算法通过对视频中的人体行为进行分析自动识别出其类别,因被广泛应用于智能视频监控、高级人机交互、智能驾驶辅助系统、体育运动动作分析等领域,近年来成为计算机视觉领域的研究热门。由于人体运动的非刚性、背景的复杂性以及相机运动的影响等,人体行为识别成为一个极具挑战的课题。本文对视频中人体运动行为的识别方法进行了研究,具体的研究工作如下:1.稠密轨迹的人体行为识别方法是对每一帧全图像密集采样,导致特征维数高、计算量大且包含了无关的背景信息,针对上述问题提出了基于显著性检测和稠密轨迹的人体行为识别方法。该方法首先对视频帧进行多尺度静态显著性检测获取动作主体位置,并与对视频动态显著性检测的结果线性融合获取主体动作区域,通过仅在主体动作区域内提取稠密轨迹来改进原算法;然后采用Fisher Vector取代词袋模型对特征编码增强特征表达充分性;最后利用支持向量机实现人体行为识别。在KTH数据集和UCF Sports数据集上进行仿真实验,相比于稠密轨迹的人体行为识别算法,识别准确率分别提升了1.2%和0.4%。2.为充分利用人体行为的时域信息同时减少帧间冗余降低特征维数,提出了提取有效视频帧并对其时间序池化的人体行为识别方法。该方法首先对视频帧的稠密轨迹特征采用局部累计描述向量编码获取视频帧特征表示;对每帧的特征编码进行余弦相似度分析,剔除冗余特征帧得到有效视频帧特征序列;采用时间序池化对有效视频帧特征序列进行排序,得到可表示视频时序动态变化的特征向量;最后利用时间序特征向量训练支持向量机实现分类识别。在HMDB51数据集和UCF101数据集上进行仿真,识别准确率分别为65.2%和89.4%。3.针对处理视频数据过程中容易造成维数灾难的问题,提出了一种线性序列差异分析的方法对视频数据降维来进行人体行为识别。首先运用ViBe算法对视频帧进行背景减除操作获取行为区域,在该区域内提取稠密轨迹特征来去除背景数据的干扰。然后对Fisher Vector编码后的特征进行线性序列差异分析,采用动态线性规整算法计算序列类别间相似度,将特征从高维空间投影至低维空间来降低特征维数。最后利用降维后的特征训练支持向量机。在KTH数据集和UCF101数据集上进行仿真,实验结果表明该算法可有效提高识别率。