基于分块和核参数选择的KPCA研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pk8984812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从二十世纪九十年代以来,核方法已经被广泛应用于模式识别与机器学习领域。作为一种基于非线性映射的非线性方法,核方法等价于先将原始数据通过非线性映射变换到一高维空间后的线性特征提取手段,其优势在于核方法允许研究者在原始数据对应的高维特征空间使用线性方法来分析和解决问题,不需要直接对数据进行映射。因此与普通的非线性方法相比,核方法的计算负担要小很多。另一方面,一般的非线性方法映射的维数往往过高不受控制,而核方法能够有效地规避“维数灾难”问题。基于核函数的主成分分析(KPCA)是模式分类问题中最常见的核方法之一。KPCA的执行等效于:首先使用非线性映射将样本变换到一个新的特征空间,然后在此特征空间中实施主成分分析(PCA)的方案。作为一种非线性主成分分析方法,尤其是对存在复杂的非线性关系的原始数据进行特征提取时,KPCA相比PCA能提取到更有利于分类的特征。KPCA同PCA一样,是一个全局方法,因此使用KPCA提取特征时,只能提取到整体特征而忽略了局部特征。在局部特征很重要的情况下,使用KPCA进行特征提取将会丢掉很多有可能很重要的局部信息。作为对原始KPCA的改进,本文第一次提出将分块机制引入KPCA,即首先将模式分为几个子块,然后对每个子块使用KPCA进行特征提取。分块KPCA(BKPCA)通过对模式的每个子块提取特征来提取局部特征。为了验证BKPCA的有效性,我们将该方法应用于环境因素变化的人脸识别中。在三个人脸库上的实验表明了BKPCA能够有效地减少环境因素对人脸识别结果的影响。因此,BKPCA是一个有效的局部特征提取算法。核方法的一个重要特点是其核函数中存在可调参数。不论使用哪一种核方法,也不论使用哪一种核函数形式,都需要具体设定核函数的参数;而且参数取不同值往往对应大不相同的应用效果。因此,对核方法进行参数选择以实现模型优化是核方法研究的一个重要方面。本文第一次提出借助一种比值(称作特征比)来调节KPCA的核参数值,在基准数据集上的实验证明了特征比与分类结果密切相关。因此在调节KPCA的核参数值时,可以通过最大化特征比来对KPCA进行参数选择。
其他文献
经济的发展以多种资源为基础,排样问题的工作主要是对材料进行优化利用,在涉及材料分割的行业有广泛的应用,如机械制造、皮革服装、建筑设计、交通运输、航空航天等领域。排
人脸识别技术最友好、自然、直接的生物特征识别手段,在社会公共安全、政府机关、视频监控、电子商务等领域都有着广泛的应用空间,人脸识别技术可分为人脸检测和识别两个基本
随着计算机技术的飞速发展,分布式异构系统逐渐成为解决复杂问题的有效工具。它的主要目标是通过网络互连实现全系统范围内的资源的共享,同时它还利用高效的资源管理和任务调
词汇语义相似度计算作为中文信息处理中的一个关键问题,国内外众多学者已对其开展了广泛而深入的研究,它是信息检索、信息抽取、文本分类、词义排歧和机器翻译等重点研究领域
下料问题存在于生产的各个领域,如剪切金属板材和带材、锯切木板、切割平板玻璃等。其中二维下料的应用较为广泛,而矩形下料是二维下料的基础。本文研究的是矩形二维板材下料
蛋白质磷酸化在细胞生长、分化、凋亡整个过程中扮演至关重要的角色。磷酸化蛋白质的特定位点能起到开关该蛋白质某种功能的目的,从而实现在不同生物过程中该蛋白发挥不同作
圆片二维下料问题广泛存在于电机、机械制造、航空航天等领域。如何提高下料过程中材料的利用率一直是排样专家研究的热点。根据现有的剪冲下料工艺,本文提出在固定大小板材
Ad Hoc网络是一种具有高度动态拓扑结构、节点任意移动的无线自组织网络。网络灵活机动、适应环境能力强,对终端性能要求不高,不需要固定基础设施的支持,具有较强的鲁棒性、抗毁
学位
最近几年来,用递归神经网络被越来越广泛的应用于推荐系统。其背后的原因是,用户的行为序列中存在一些固有的模式,而递归神经网络往往能很好的挖掘出这些模式。递归神经网络
业务流程是为特定的对象(客户)创造价值的过程,是达成特定目标的一系列相互关联、有组织的活动或任务。作为一种特殊的组合服务,业务流程可以被封装成可重用的组件形式并集成