论文部分内容阅读
人脸识别技术是生物识别领域的一个重要分支,人类面部的高维数据信息足以支撑有效的个人身份验证。因此近几十年来,针对人脸信息的研究和应用层出不穷。相继提出了一系列不同的特征提取和分类算法,并取得了良好的效果。本文以二维人脸图像作为研究对象,对线性鉴别分析和基于稀疏表示的分类(Sparse Representation-based Classification,SRC)框架算法进行相关研究。在SRC框架中,人脸图像被直接当作字典,测试样本被表示为所有训练样本的线性组合。理想的分解系数是:真实类别的分解系数非零而其余类别的系数都为零。但是由于面部图像组成的字典并不严格满足稀疏分解的条件,再加上人脸对齐、采样误差和噪声等等因素的影响,得到的分解系数并不是严格稀疏的。所以字典的优化、分解系数计算方式的改变以及字典的淘汰策略都是本文研究的方向和重点。此外,通过深入研究线性鉴别分析(Linear Discriminant Analysis,LDA)的框架,我们发现在原始的模糊鉴别分析算法的散布矩阵定义的步骤中,每一个样本的隶属度信息对于散布矩阵所做的贡献并没有被体现出来。针对此情况,将每一个样本的隶属度,根据它对散布矩阵重定义所做的贡献重新融入到特征抽取的过程中,从而得到了完整有效的模糊样本特征向量集。本文取得的主要研究成果和创新点包括:(1)将层次多尺度局部模式特征(Local Binary Patterns,LBP)和类别剔除策略引入SRC框架,并且在稀疏系数分解的过程中使用贪婪搜索的方法获得解空间。原始的SRC框架将人脸图像直接用作训练字典,并没有使用特征向量代替原始的人脸图像的特征。局部特征(Local Patterns)因为其计算的简便性和处理的有效性,一直都被用于纹理分类中,在这里我们首先提取原始人脸图像的层次多尺度的LBP特征,相比较于传统的LBP特征,层次多尺度的LBP特征充分挖掘非均匀的二值化模式,试图寻找面部特征更多的鉴别性信息。此外,我们还设计了迭代循环剔除类别的方式,来确定最终的线性表示的系数,旨在找到最优的线性组合来重构测试样本并完成分类。在ORL、FERET和AR三个人脸数据库上,提出算法的识别率可比其余的基于表示的分类算法至少提高2个百分点,进而验证了算法的有效性。(2)在SRC的分类框架中,通过构造虚拟样本的方式来获得额外的训练样本,并提高分类精度。在本文中使用的三种构造虚拟训练样本的方式:原始训练样本的镜像文件、原始训练样本间的加权平均样本以及三维形变模型生成的虚拟样本。在虚拟样本中,使用局部算子获得图像的层次多尺度的局部特征描述,为了加快计算速度和减少特征向量的维数,使用主成分分析(Principal Component Analysis,PCA)的方法对特征向量做降维处理。虚拟样本可以模拟真实样本的可能的变化和趋势,但是并不能保证所有样本都会对最终的分类起到积极的作用,所以在评价每个类别的样本在重构测试样本的能力的时候,首先剔除一部分距离测试样本较远的离群样本。这样才能突出真实类别的样本的贡献程度,保证分类的质量。相比较于迭代循环剔除类别的方式,我们设计了一次性剔除若干训练样本的方式,在提高运算速度的同时仍可以保留一定比例的原始和虚拟混合训练样本来线性表示测试样本。在实验部分,通过对比加入虚拟样本和不加入虚拟样本的结果,印证了虚拟样本的有效性。(3)扩展局部二值模式(Local Binary Patterns,LBP)到广义的多尺度局部量化模式(Local Quantized Patterns,LQP)来提取图像的特征,并应用在SRC的分类框架中。二值局部模式的编码方式严重限制了可以使用的模式的形状和尺寸,并且依赖于非常粗糙的定性灰度值进行比较。在LQP中,通过改变不同的形状和引入更多的像素,使得局部特征更加有效。在这里,我们将人脸图像分成高分辨率、中分辨率和低分辨率三个尺度,并在每个尺度中提取LQP特征,替代原始的人脸图像,作为SRC框架中的样本字典。(4)在处理彩色图像的时候,使用四元数的方式来存储和表示彩色像素的RGB值,四元数可以将彩色像素的三个分量简单地表示为一个“数”的形式,进而彩色图像可以被表示为四元数矩阵的形式参与运算。本文采用线性判别分析的算法,将四元数矩阵变换到低维四元数子空间,并且在这个低维空间中进行分类。传统的针对彩色图像的处理方法是处理灰度图像或是将RGB彩色图像转化为HIS颜色空间而只处理强度信息。当然也可以将彩色图像分别在各个颜色通道中分别作处理并融合最终的结果。在我们的试验中,在GT彩色数据库中12个训练样本的情况下,我们的四元数LDA的方法的识别率达到80.7%。(5)提出一种改进的模糊监督学习算法。与传统的模糊LDA方法相比,所提方法计算出与每个训练样本分类隶属度相关联的鉴别矢量,这在理论上有效地减少了每个样本不精确的分类评价所带来的分类错误。与此同时,我们对该模型利用核方法进行非线性判别信息的提取,进一步解决了非线性分类问题。从而将改进的核模糊LDA算法作为监督学习的工具。