论文部分内容阅读
核方法是20世纪90年代模式识别与机器学习领域兴起的一场技术性革命。其优势在于核方法允许研究者在原始数据对应的高维特征空间使用线性方法来分析和解决问题,不需要直接对数据进行映射。但是应当指出,核方法在对待测样本进行特征抽取时,需要计算其与所有训练样本间的核函数,因此训练样本的个数直接制约了核方法的特征抽取效率,在实际的大样本集分类应用中,该方法的特征抽取率将非常低,甚至难以应用。因此在保证识别率的前提下,寻求提高核方法的特征抽取效率的工作是非常有现实意义的。本文根据对核方法目前研究现状的分析,对KMSE方法提出两种改进方案,并通过matlab仿真实验证实了这些方案的有效性。另外本文还提出一种基于PCA的特征选择方案,并在人脸数据库上做了对比实验。本文的主要研究内容及结果如下: (1)结合在特征空间中“关键样本”应能较好代表训练集的思路,提出一种联合KPCA与KMSE的快速分类方案。首先用KPCA方法选出第一个“关键节点”,并依次选出“候选样本集”,然后判断候选样本集中样本的相关性大小,从而从中选出最不相关的一部分“关键节点”,最后利用这部分“关键节点”与KMSE方法对测试集进行分类。实验在7个基准数据库上进行,与原KMSE方法相比较,我们的方法仅仅用了只占训练样本1.71%~30%的“关键样本”,就得到了相当于原KMSE方法的正确率,时间上也比原KMSE方法提高了26.31%~81.42%。 (2)同样使用“关键样本”的概念,提出一种基于条件数的KMSE改进方案。本方案包含两部分:第一部分根据条件数越小,解的数值稳定性越好的性质,依次在训练样本中选取出使得核矩阵的条件数小的那些“关键样本”;第二部分利用这些“关键样本”构造KMSE模型进行分类。实验在3个基准数据库上进行,与原KMSE方法相比较,仅仅用2.5%~12.14%的训练样本,就得到了相当于原KMSE方法的正确率,时间效率上比原KMSE方法提高了65.55%~95.88%。 (3)给出了一种PCA应用于特征选择的多类别分类方案,并利用特征选择和特征提取的联合方案进行了人脸识别实验。为了实验充分,对比了四种不同实验方案下的实验结果,包括取不同的训练样本与测试样本比例,取不同的特征选择维数和特征抽取维数等。结果表明,在AR数据库上考虑光照、表情以及遮挡物的变化时,我们的实验方案获得的分类正确率普遍有所提高。 (4)我们还用KMSE方法对夹芯板超声检伤数据进行了分类实验,数据分为6种,有无损伤的夹心板超声波数据、上层钢板与芯材脱胶时的数据、下层钢板与芯材脱胶时的数据、还有钢板受到撞击产生凹坑的数据等。实验证明分类效果良好,特别是上层钢板与芯材脱胶时的超声波检伤数据的分类正确率最高达到80%的正确率。