【摘 要】
:
主成分分析(PCA)是一种降低数据维度的技术。PCA利用正交变换捕捉数据的主要线性特征,减少冗余数据的同时尽可能的增加数据的解释性。然而,PCA本质上是一种线性方法,无法捕捉数据中的非线性特征。核主成分分析(KPCA)在PCA中引入核技巧,隐式地计算非线性映射函数的点积,在高维特征空间中有效地捕捉数据的高阶统计性质。故KPCA被广泛应用于众多专业领域,如图像降噪和面部识别。KPCA需要计算核矩阵的
论文部分内容阅读
主成分分析(PCA)是一种降低数据维度的技术。PCA利用正交变换捕捉数据的主要线性特征,减少冗余数据的同时尽可能的增加数据的解释性。然而,PCA本质上是一种线性方法,无法捕捉数据中的非线性特征。核主成分分析(KPCA)在PCA中引入核技巧,隐式地计算非线性映射函数的点积,在高维特征空间中有效地捕捉数据的高阶统计性质。故KPCA被广泛应用于众多专业领域,如图像降噪和面部识别。KPCA需要计算核矩阵的特征分解,标准的矩阵特征分解方法的时间复杂度和空间复杂度分别为O(n3)和O(n2)。为了解决大型核矩阵特征分解的计算成本问题,一种常用的方法是用线性预测问题来近似核学习问题,该类别中最著名的方法是随机傅里叶特征和Nystr(?)m方法。特别地,Sterge等人最近证明了Nystr(?)m子抽样技术可在不损失KPCA统计性能的前提下,将时间复杂度和空间复杂度分别降低为O(n(log n)4)和O((log n)4)。注意到,现有基于Nystr(?)m子抽样的KPCA大都假定核函数的均值为零,所得算法并不适用于一般的核函数,例如Gaussian函数。本文将针对一般的核函数,研究基于Nystr(?)m子抽样的KPCA(NY-KPCA)。特别地,我们将从函数逼近的观点建立NY-KPCA的表示定理,并给出NY-KPCA训练(测试)误差公式。此外,我们研究了 K-medoids采样技术对NY-KPCA精度的影响。文章利用NY-KPCA和SVM进行多项数值实验,在合成和真实数据集上的实验结果证明了 NY-KPCA算法的前景。
其他文献
自拓扑优化的研究不断发展以来,该领域下的各种设计方法为大量的重大工程与工业领域内的结构设计提供了指导性的方案。而随着不断升级的产业对于结构的细节设计要求的提高以及可制造能力的增强,原有的拓扑优化设计框架所得到的结构拓扑设计在细节上有时会难以满足实际生产的一些需求,例如会出现不光滑的结构边界以及局部的应力集中等诸多问题。基于移动可变形组件(MMC)的拓扑优化方法通过拓扑描述函数显式地表征结构的拓扑信
深海油气资源和海上风电的开发利用都离不开海底结构物,这些结构物直接或间接与海洋黏土存在相互作用,海洋黏土的强度特性对结构物的设计至关重要。带助推器的自由落体式球形贯入仪(Free Fall Ball Penetrometer with a Booster,FFBPB)将助推器和球形贯入仪结合,既具有全流贯入仪的优点,又提高了测量的深度范围,结合力和加速度数据可提高土体抗剪强度的预测精度,在海洋黏土
自升式平台是海洋能源开发领域应用较为广范围的一种平台型式。钻井平台、维修平台、海上风电安装平台等自升式平台靠作业臂进行工作。由于作业臂极限长度的限制,桩靴安装位置与邻近基础距离较近,不可避免对基础稳定性造成一定不利影响。本文针对桩靴基础贯入、拔出对邻近沉垫和大直径桩基的位移影响进行研究。并对大型沉垫基础坐底工作时,循环承载力的评价提出了一种简单方法。首先,利用耦合的欧拉-拉格朗日法(CEL)模拟了
在本文中,我们考虑了一类带有对数非线性项的伪抛物Kirchhoff方程的初边值问题.由于对数型Sobolev不等式的失效,我们引入了Gagliardo-Nirenberg不等式和p-范数插值不等式.我们利用位势井方法,证明了在不同的初始条件下,方程解的存在性、爆破性等.本文具体内容如下:1.当初始能量J(u0)≤d时,验证了弱解的全局存在性与有限时刻爆破性.同时,我们还给出了整体解的指数型衰减估计
圆柱结构是海洋建筑物中常出现的结构型式,波浪沿着柱体会产生涌高效应,对结构上部建筑构成一定威胁。特别是随着深水结构物的不断出现,深水中极端波浪在结构上产生的涌高具有较强的非线性,如何准确计算波浪涌高,合理设计结构高度,减小波浪涌高造成的影响是结构设计时关注的问题之一。本研究在实验室内,通过物理模型试验的方法,考虑不同波浪参数,分别模拟了规则波、不规则波和聚焦波与圆柱结构的作用,对圆柱结构周围波浪涌
利用变分法中的鞍点定理等,本文主要研究了一类双共振分数阶椭圆型偏微分方程边值问题的可解性,证明了在一定条件下,特别是在经典的Ahmad-Lazer-Paul条件下,这类边值问题至少存在一个解,并作为特例,给出了分数阶拉普拉斯算子下的这类边值问题的可解性.此外,本文还研究了这类问题当非线性项添加一定条件后,利用Morse理论中临界群的相关计算知识得出了这类边值问题的非平凡解的存在性和多解性,并且同样
在经典概率中,假设了概率和期望值的可加性.但是实际上,这种可加性假设在许多应用领域中都不可行,因为不确定性现象无法使用可加性概率或可加性期望进行建模.非可加概率和非可加期望是研究统计中的不确定性,风险度量,金融对冲和非线性随机演算的有用工具.近年来,非线性期望的理论和方法已经得到了很好的发展,并在诸如金融风险计量和控制等应用领域受到了广泛的关注.彭实戈教授在倒向随机微分方程的框架中引入了非线性期望
目的观察甲醛(FA)对人肝癌HepG2细胞内胆汁酸合成和外排影响,探讨甲醛引起肝细胞损伤机制。方法以不同浓度甲醛对HepG2细胞染毒12、24和48 h,采用细胞毒性试验(MTT法)检测细胞活性;以不同浓度甲醛对HepG2细胞染毒24和48 h,采用化学-酶法测定HepG2细胞内总胆汁酸(TBA)含量;采用实时定量PCR法检测细胞内胆汁酸合成相关基因胆固醇7α–羟化酶(CYP7A1)、固醇12α羟
近海地区存在着波浪与各类水流,如潮流、沿岸流与裂流等。其中水流速度不仅在水平方向存在空间分布差异,同时在垂向上具有一定的垂向分布。水流的垂向分布导致波浪在不同水深处受到的水流影响不同,使波能沿水深分布发生变化,因此在海岸工程设计与研究近海地形演化问题时,需要考虑水流垂向分布对波浪传播变形的影响。Boussinesq类方程可以针对任意水深处速度建立,且形式简单,拓展性强,因此本研究采用此类方程研究波
在观察性研究中,倾向得分被广泛地用于估计因果效应.近些年提出的协变量平衡倾向得分方法,在估计倾向得分时,通过优化协变量平衡得到更为稳健的估计.在医学和流行病学研究中的某些情况下,感兴趣的结果变量是生存时间.在估计处理分配机制对生存时间的影响时,由于生存数据具有删失和截断等特征,使得完整数据下的估计方法不能直接使用.本文考虑的结果变量为带有右删失的生存时间,基于调整后的协变量平衡倾向得分和加权最小二