论文部分内容阅读
近年来,随着信号处理理论和计算机的发展,人们开始用摄像机获得周围环境图像并将其转换成数字信号,用计算机实现对视觉信息的处理,这就形成了计算机视觉这门学科。成像在视网膜上的图像信息是人类视觉系统工作的基础,因此计算机视觉的发展必然以人类视觉系统的能力为参照。人类视觉系统的一个基本任务是识别人类、物体及其相互之间的空间关系。计算机视觉研究者也有着相似的目标,那就是研究在场景中定位和识别目标的方法。在该领域研究中,对人的定位和识别由于其巨大应用价值,受到了广泛的关注。在本论文中介绍了相关的前沿技术,并描述了笔者在此领域中的研究工作。本文特别将人物的识别问题分为两部分——人脸识别和步态识别。
识别系统的初始输入为视频序列(单一图像是其中的特例)。由于采集视频的条件不同,图像的分辨率不同,识别性能也会有差别。就目前的技术而言,人脸识别的精度往往高于步态识别,但是前者对视频分辨率的要求较高,而且在每一帧图像中人脸区域大小有所限制。而步态识别能够使用低分辨率数据提取身体各部分的运动信息,达到鲁棒的识别效果。换句话说,能够使得步态识别达到较好性能的视频数据,其分辨率往往不需要达到人脸识别的要求。因此将两者结合起来能满足不同环境下的需要,对解决视频序列中人物身份识别这一难题有很强的应用价值。本文的主要研究成果如下:
非限制条件下的人脸识别是人脸识别领域的一个难点。针对人脸姿态变化问题,本文提出了一种自动的3D人脸重建方法,利用ASM模型进行自动人脸标注,结合Candide三维人脸模型完成人脸的重建。针对光照变化问题,提出了一种位平面加权融合的策略,将人脸图片进行位平面分解,并进行加权融合。分析和实验结果表明,本文提出的策略适合多角度不同光照下的人脸识别。
视频中的人脸识别技术是近年来的一个研究重点,相对于基于静态图片的人脸识别,视频人脸识别拥有丰富的时序特征,因此识别性能更加可靠。本文提出了一种基于HMM的视频人脸识别算法,利用视频序列的连续性和对大量训练样本的统计分析来提高在无约束环境下判别分析方法的鲁棒性。实验表明,该方法可以有效地提高识别算法对姿态和光照变化的鲁棒性,提高识别率。
人体侧影分割的质量对步态识别的性能有直接的影响。本文提出了一种鲁棒性的步态识别方法,利用光流特征提取视频中的运动信息,并将人体区域按人体结构特点划分为多个子区域,然后对每个子区域进行椭圆拟合建立人体结构模型。识别阶段提取模型参数作为步态特征,结合动态时间规整技术解决了动态模式的相似度量和匹配问题。实验表明,该算法可以有效地提高识别算法的鲁棒性,并且具有较好的识别性能。