论文部分内容阅读
作为典型的模式识别任务,人脸识别有着巨大的实际应用价值与市场前景。理想环境下的人脸识别已经取得不俗成绩,然而,当所处环境变化(如姿态变换、夸张表情、阴阳脸、分辨率较低)时,识别难度增加,效果也急剧变差。与此同时,现有方法大多数无法实时(在线)完成人脸识别任务,这也限制了人脸识别技术的应用。本文在浙江省大学生科技成果推广项目(2013R407063)的赞助下,以人脸识别的背景及目的意义为出发点,考虑到人脸的三维结构,分析研究了基于三维人脸建模的多视角人脸识别方法,本文主要完成了以下几方面的研究工作:(1)人脸检测阶段:为了确保系统的稳定性与实时性,选择了基于AdaBoost的人脸检测算法并将所得的分类器打包成XML文件的形式,为以后的实时人脸识别系统的搭建打下了基础。(2)三维人脸建模方面:在比较几种基于图像的三维人脸建模方法后,选择了基于单张正面的照片的三维人脸建模方法,与常规方法相比,该方法的可行性与实用性高,方法可以无缝链接到人脸识别系统中。本文提出了一套基于Candide-3的三维人脸建模方法,具体分为两步:首先,使用改进的ASM(主动形状模型)算法对定位正面人脸的特征点进行定位并根据临近点插值法确定非特征点坐标;然后,在纹理贴图阶段,本文依据DMS样条函数,在Candide-3标准模型的基础上生成了含更多顶点的人脸模型,使得建立的模型真实感和连续性更好。最后,给出了根据所建三维人脸模型生成的多视角人脸图像。(3)在人脸图像特征提取阶段:本文提出了基于深度神经网络的人脸识别方法,本文的深度神经网络的训练分为两步:无监督阶段与有监督阶段。其中,在无监督阶段,使用Sparse Autoencoder在大规模人脸库LFW的基础上进行图像恢复以训练深度神经网络。与此同时,为探讨网络层数对于识别效果的影响,本文训练了多种多层数的神经网络,实验结果表明,识别率并非与网络层数正相关;有监督阶段,采用邻近元分析的方法,利用混合人脸库人脸的多样性(多姿态、多表情、多种光照),有目的地提高网络对于人脸的理解能力,减小相同人脸间距离,增大不同人脸间距离。实验结果表明,较传统方法,本文提出的特征提取算法可提取人脸图像的深度特征,适用于人脸姿态、表情、光照变化较大的人脸识别任务中,对于人脸识别方法的探究是一次有益的尝试。(4)在实际的人脸识别过程中:提出了一种“搜索半径”的概念。首先将每张图像用二进制数据表示。在图像检索过程中,先计算出图像间的二进制数据间的汉明距离,然后按照汉明距离排序,在汉明距离较小的半径内,寻找与待识别图像欧式距离最小的图像,根据阈值,确定该图像是否是待识别个体。实验结果表明,本套识别方法所用识别时间极小,适合于对实时性要求较高的人脸识别任务。(5)最后,本文将所有的算法整合起来,利用OpenCV、OpenGL、Armadillo等库搭建了人脸实时识别系统,并演示了系统的具体操作。实验结果表明,本套人脸系统识别效果好,识别时间短,是人脸识别较为理想的方案。