快速核方法设计与PCA之特征选择应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yuanpeihai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核方法是20世纪90年代模式识别与机器学习领域兴起的一场技术性革命。其优势在于核方法允许研究者在原始数据对应的高维特征空间使用线性方法来分析和解决问题,不需要直接对数据进行映射。但是应当指出,核方法在对待测样本进行特征抽取时,需要计算其与所有训练样本间的核函数,因此训练样本的个数直接制约了核方法的特征抽取效率,在实际的大样本集分类应用中,该方法的特征抽取率将非常低,甚至难以应用。因此在保证识别率的前提下,寻求提高核方法的特征抽取效率的工作是非常有现实意义的。本文根据对核方法目前研究现状的分析,对KMSE方法提出两种改进方案,并通过matlab仿真实验证实了这些方案的有效性。另外本文还提出一种基于PCA的特征选择方案,并在人脸数据库上做了对比实验。本文的主要研究内容及结果如下:  (1)结合在特征空间中“关键样本”应能较好代表训练集的思路,提出一种联合KPCA与KMSE的快速分类方案。首先用KPCA方法选出第一个“关键节点”,并依次选出“候选样本集”,然后判断候选样本集中样本的相关性大小,从而从中选出最不相关的一部分“关键节点”,最后利用这部分“关键节点”与KMSE方法对测试集进行分类。实验在7个基准数据库上进行,与原KMSE方法相比较,我们的方法仅仅用了只占训练样本1.71%~30%的“关键样本”,就得到了相当于原KMSE方法的正确率,时间上也比原KMSE方法提高了26.31%~81.42%。  (2)同样使用“关键样本”的概念,提出一种基于条件数的KMSE改进方案。本方案包含两部分:第一部分根据条件数越小,解的数值稳定性越好的性质,依次在训练样本中选取出使得核矩阵的条件数小的那些“关键样本”;第二部分利用这些“关键样本”构造KMSE模型进行分类。实验在3个基准数据库上进行,与原KMSE方法相比较,仅仅用2.5%~12.14%的训练样本,就得到了相当于原KMSE方法的正确率,时间效率上比原KMSE方法提高了65.55%~95.88%。  (3)给出了一种PCA应用于特征选择的多类别分类方案,并利用特征选择和特征提取的联合方案进行了人脸识别实验。为了实验充分,对比了四种不同实验方案下的实验结果,包括取不同的训练样本与测试样本比例,取不同的特征选择维数和特征抽取维数等。结果表明,在AR数据库上考虑光照、表情以及遮挡物的变化时,我们的实验方案获得的分类正确率普遍有所提高。  (4)我们还用KMSE方法对夹芯板超声检伤数据进行了分类实验,数据分为6种,有无损伤的夹心板超声波数据、上层钢板与芯材脱胶时的数据、下层钢板与芯材脱胶时的数据、还有钢板受到撞击产生凹坑的数据等。实验证明分类效果良好,特别是上层钢板与芯材脱胶时的超声波检伤数据的分类正确率最高达到80%的正确率。
其他文献
期刊
随着化石能源的减少,能源问题已成为世界性的问题。太阳能自然通风技术在世界各地发展起来,鉴于太阳能不能进行充分利用,提出了相变蓄热通风,为了使室内热湿环境符合人体的热
涡动力学是研究非定常空气动力学的一个有力切入点。历史上诞生过许多不同的非定常涡动力学模型,在一定的前提条件和假设下,这些模型简化为涡系运动模型。由于理论研究和实际应
期刊
随着社会的进步和现代化工业的发展,单一材料已经很难满足人们在工程实际中的需要,而多层介质由于其灵活的性能组合,在生产和生活中发挥着越来越重要的作用。然而,由于在不同材料
期刊
杆系结构是最常用的结构形式之一,导致其失效的主要形式是结构的整体屈曲,因此对杆系结构进行屈曲分析有着重要的意义。目前对于杆系结构的静力屈曲的研究已经十分成熟,然而对
船舶在大海上航行时,会遭受各种极端恶劣的天气,当波浪达到一定的程度时,就会发生甲板上浪。甲板上浪是一种比较常见的情况,但是甲板上浪会对船舶的性能、结构稳定度和船舶的安全
期刊
对含动边界非定常流场进行数值模拟已成为当今世界计算流体力学(CFD)研究的热点之一,而其中的一项关键技术就是动网格的生成。本文结合国家自然科学基金项目“动边界下计算方