论文部分内容阅读
众所周知,特征提取是模式识别领域中最基本和最重要的问题之一,而提取模式中的有效特征或关键特征是提高识别率的一种途径。在基于图像的对像识别领域,特别是在人脸图像识别中,由于原始的样本图像数目较少而维数相当高,如何提取关键特征进行维数约简与识别是当前研究的一个难点与热点问题。线性特征提取是当前人脸特征提取中的基本方法。它的基本思想是将原始模式映射(或变换)到某一低维本征子空间,以获取在某个准则下最能反映模式本质的低维特征。到目前为止,人们已提出了许多线性特征抽取方法,两个最经典的方法是主成分分析(Principal Component Analysis,简称为PCA或称K-L变换)和Fisher线性鉴别分析(Linear Discriminant Analysis,简称为LDA)。但这些经典的方法,并不能得到可解释的关键特征,其原因在于由这些方法所得的投影是训练样本的非零线性组合。最近的研究表明,引入稀疏性进行特征选择,不仅可以得到较好的预测效果,给出合理的特征层面上的语义解释,而且为我们揭示了哪些特征对分类与预测起主导作用。据此,我们把稀疏性引入到鉴别分析上来,并结合流形学习,提出了一系列稀疏特征提取算法。本文主要贡献如下:(1)本文全面归纳了经典的线性投影方法即PCA、LDA及其2D拓展、稀疏性拓展。(2)在稀疏的局部保持投影的基础上,本文利用极大边界准则,提出了稀疏的局部鉴别投影方法,并在此基础上分析了基于向量的稀疏投影学习方法普遍存在的不足之处。(3)在流形学习的基础上,提出了一个基于图像矩阵的稀疏投影学习框架。在这个框架下,本文给出了两个具体的稀疏投影学习算法。这个算法框架不仅克服了现有的基于向量的稀疏投影学习方法的几个不足之处,我们还以入脸图像为例子,给出了基于图像的稀疏特征提取的直观的语义解释。此外,我们还给出了基于图像矩阵的稀疏特征提取的全新解释:人脸图像稀疏特征提取本质上是把人脸图像投影到稀疏的人脸肖像子空间中,而人脸图像的分类,就是用肖像子空间的特征进行分类。换句话说,本文所提出的稀疏脸方法为人们展示了哪些特征和什么样的特征是人脸图像流形的内蕴特征。(4)本文提出了基于图像矩阵的稀疏投影逼近理论及其算法框架。理论分析表明,由该算法框架所得到的稀疏投影子空间逼近由本征方程所决定的子空间。通过分析基于向量的及基于图像矩阵的稀疏学习方法间的特性,我们以性质定理的方式给出了它们之间的本质联系。这些性质定理,为基于向量的稀疏投影学习方法提供了理论的保证。(5)本文还给出了含有Kronecher积的快速图谱特征分析方法,并把三种基于向量的回归方法拓展为基于图像矩阵的回归方法进行稀疏投影学习。