论文部分内容阅读
社会的进步和科学技术的发展使得人们对公共安全及生活质量的要求不断攀升,人们希望生活环境更加智能、舒适、便捷,这使人机交互越来越成为学术界的研究热点。人体行为识别作为人机交互的基础,具有重要的理论研究意义和广阔的应用前景。本论文通过分析行为识别的国内外研究现状,得知基于视觉的人体行为识别易受背景噪声、光线变化和衣物遮挡等条件的影响,而且部分算法计算复杂,稳定性差,难以适应实时应用场景。为了克服上述问题,本论文在行为目标检测、特征提取与描述、行为分类与识别三个方面进行了研究,主要完成的研究工作如下:1、基于改进运动历史图(Motion History Image,MHI)的运动分割方法。利用等间隔采样提取关键帧以提高MHI的计算效率,通过帧间差分法获得关键帧的目标轮廓,并更新目标轮廓像素点的灰度值,进一步合成MHI。相比于原始MHI的计算方法,该方法显著降低了参数估计的复杂度,而且能够更好地捕捉到视频中的关键运动信息。2、基于多特征提取的行为识别算法。利用方向梯度直方图(Histogram of Oriented Gradient,HOG)算子、局部二值模式(Local Binary Pattern,LBP)算子和Gabor滤波器提取改进MHI的方向梯度特征、灰度统计特征和多尺度多方向的纹理特征,通过Adaboost算法进行分类识别,实验表明,改进的MHI无论是从灰度信息、梯度信息还是纹理信息层面均具有良好的可分性。3、提出一种基于能量特征的降维算法,利用该算法对高维的LBP特征向量和Gabor特征向量重新编码,获得两种低维的新特征局部二值模式能量特征(Energy Block-Local Binary Pattern,EB-LBP)和 Gabor 能量特征(Energy Block-Gabor,EB-Gabor)。通过与常用的主成分分析(Principal Component Analysis,PCA)降维算法进行比较,表明该方法能够保留更多的差异化信息,其获得的特征行为识别效果更好。4、提出一种基于可信度分配的决策级融合算法。根据不同特征的行为识别结果分配不同的可信度,通过决策级融合获得最终判决结果,提高系统容错能力。实验表明,该算法获得的判决结果的行为分类准确度更高。本论文以KTH视频数据库为基础,主要针对打拳、拍手、挥手、慢跑、快跑、步行等六类日常行为进行识别。通过实验分析,基于改进MHI的运动分割方法能够很好地分割出运动前景,提高行为识别准确率;利用能量特征提取算法可以有效降低原始特征维度;基于可信度分配的决策级融合算法能够进一步提高系统性能。上述研究成果可以进一步扩展到虚拟现实、智能视频监控和公共安全等实际应用场景,因此其具有很高的经济价值与社会价值。