论文部分内容阅读
人脸识别凭借自身的直观性、隐蔽性、简易性等优点在人工智能领域得到了越来越广泛的应用。近年来,随着深度学习的兴起,基于深度学习的人脸识别成为了学术界人工智能领域的炙热点。针对人脸姿态以及数据中的噪声,导致人脸识别性能下降问题,本文在自编码和卷积神经网络的基础上,对人脸识别算法进行了深入的探索和研究。 首先,为解决噪声对人脸识别性能影响问题,提出一种基于最大相关熵的堆栈稀疏自编码网络的人脸识别方法。该方法采用最大相关熵作为网络的重构函数,由于多层非线性映射层构成的深度网络比浅层更加有效,故构建了一个多层网络,同时引入稀疏约束项。在YaleB和AR人脸数据库上的实验结果表明,训练样本在加噪或不加噪情况下,提出的方法相比传统的堆栈稀疏自编码网络识别性能有所提升,学习到的特征也更具鲁棒性。 其次,针对人脸姿态变化对人脸识别性能产生的影响,在局部卷积神经网络的基础上,提出了一种改进的局部卷积网络(ILCN)人脸姿态去除与识别方法。该方法通过在网络中引入分离层将网络分成两个通道:一个通道用于产生中间层重构函数,另一个通道用于进一步进行卷积操作。最终将中间层的重构函数作为顶层代价函数的一个约束项,来进一步保证顶层重构正脸的质量。实验结果表明,提出的方法能够有效的将各个姿态下人脸图片较好的恢复出正脸图片,且恢复出来的图片具有较好的局部信息。最后将去除姿态的人脸图片采用LDA进行特征提取,并利用最近邻分类器做识别。ILCN同基于2D和3D去除姿态的人脸识别方法相比识别率有较大提升。 最后,研究了一种编解码深度网络(EDDN)的人脸识别方法,该方法与ILCN相比,EDDN更侧重的是特征的提取而非正脸的重建。ILCN能够更好的实现各姿态下人脸到正脸的重建,且重建出来的正脸图片具有较好的纹理信息。EDDN由编解码两个过程构成,编码过程为一个多层感知机,通过逐层压缩特征的维度使得提取的特征对人脸姿态更具鲁棒性,解码过程实现的是重构正脸。实验结果表明,尽管EDDN重建出来的正脸信息相比ILCN具有较大差距,但提取的特征对人脸姿态具有较强的鲁棒性,取得了较高的识别性能。