论文部分内容阅读
自从二十世纪九十年代以来,核方法已经被广泛应用于模式识别与机器学习领域。作为一种基于非线性映射的非线性方法,核方法等价于先将原始数据通过非线性映射变换到一高维空间后的线性特征提取手段,其优势在于核方法允许研究者在原始数据对应的高维特征空间使用线性方法来分析和解决问题,不需要直接对数据进行映射。因此与普通的非线性方法相比,核方法的计算负担要小很多。另一方面,一般的非线性方法映射的维数往往过高不受控制,而核方法能够有效地规避“维数灾难”问题。基于核函数的主成分分析(KPCA)是模式分类问题中最常见的核方法之一。KPCA的执行等效于:首先使用非线性映射将样本变换到一个新的特征空间,然后在此特征空间中实施主成分分析(PCA)的方案。作为一种非线性主成分分析方法,尤其是对存在复杂的非线性关系的原始数据进行特征提取时,KPCA相比PCA能提取到更有利于分类的特征。KPCA同PCA一样,是一个全局方法,因此使用KPCA提取特征时,只能提取到整体特征而忽略了局部特征。在局部特征很重要的情况下,使用KPCA进行特征提取将会丢掉很多有可能很重要的局部信息。作为对原始KPCA的改进,本文第一次提出将分块机制引入KPCA,即首先将模式分为几个子块,然后对每个子块使用KPCA进行特征提取。分块KPCA(BKPCA)通过对模式的每个子块提取特征来提取局部特征。为了验证BKPCA的有效性,我们将该方法应用于环境因素变化的人脸识别中。在三个人脸库上的实验表明了BKPCA能够有效地减少环境因素对人脸识别结果的影响。因此,BKPCA是一个有效的局部特征提取算法。核方法的一个重要特点是其核函数中存在可调参数。不论使用哪一种核方法,也不论使用哪一种核函数形式,都需要具体设定核函数的参数;而且参数取不同值往往对应大不相同的应用效果。因此,对核方法进行参数选择以实现模型优化是核方法研究的一个重要方面。本文第一次提出借助一种比值(称作特征比)来调节KPCA的核参数值,在基准数据集上的实验证明了特征比与分类结果密切相关。因此在调节KPCA的核参数值时,可以通过最大化特征比来对KPCA进行参数选择。