论文部分内容阅读
随着计算机及网络技术的迅猛发展,多媒体信息已经渗透到人们生产生活的各个方面,并且在近年来呈现出信息交互频繁、数据海量增长、云端服务日益完善的发展特点。视频作为载有文字、图像、音频等信息的文件形式,在海量数据中占有重要的地位。在大数据时代的背景下,面对大量视频数据的智能分析需求,计算机视频领域的相关研究和应用显得更加突出。作为计算机视频领域的重要一部分,人体行为识别在视频监控、视频内容分析和人机交互等方面具有广泛的应用前景。人体行为识别关键在于特征的提取,因此提取的特征也是影响识别结果的决定性因素之一。针对特征的提取,近三十年来国内外的高校、科研机构对人体行为识别进行了广泛深入地研究,取得了丰硕的学术成果,推动了人体行为识别研究向更高更深的层次发展。本文研究的是基于多慢特征融合的人体行为识别方法,首先提取多种局部特征,对其进行慢特征分析,计算形成相应的慢特征,然后采用底层特征组合和高层特征融合的方法,对单人行为和多人行为进行识别。论文介绍了多慢特征融合方法所涉及到的基本理论和方法,重点分析慢特征分析学习策略和融合方法的特点,在此基础上提出了基于多慢特征融合的人体行为识别方法。本文的主要研究内容包括多慢特征分析和多慢特征融合两个阶段。在多慢特征分析阶段,首先提取梯度方向直方图、光流直方图和尺度不变特征转换直方图三种特征,然后采用带监督的慢特征分析方法学习每种特征的慢特征函数,之后根据学习得到的慢特征函数,选择累积导数平方的形式计算得到上述每种特征对应的慢特征,从而表达视频中变化缓慢的时空信息,最终形成多慢特征。在多慢特征融合阶段,本文分别采用底层特征组合和高层特征融合的方法对多个慢特征进行融合。对于底层特征组合,本文直接将上述三种慢特征向量级联形成组合特征向量,然后送入支持向量进行分类;对于高层特征融合,本文将上述三种慢特征分为训练样本和测试样本,对该样本训练得到不同慢特征的交叉验证精度参数,将其作为高层特征融合的权值,然后对每种慢特征分别采用支持向量机对人体行为进行分类,得到各自的分类结果,将每种特征的分类结果进行加权计算,最终确定高层特征融合后的分类结果。在实验部分,本文分别在Weizmann库、KTH库、UT-Interaction库和CISAC库上对提出的算法进行验证,实验结果表明本文提出的多慢特征融合方法对单人和多人行为能够获得较好的识别效果,在视频分析和安全预警方面也有潜在的应用价值。