L1-PCA算法的若干研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qianxiaoping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习,数据挖掘等领域,往往需要处理大规模的数据,同时数据实际上通常都处于低维空间中,因而为了更好,更快速地对数据进行处理,我们需要对数据进行降维。PCA算法简单,容易求解,且能取得最优解,是一种应用十分广泛的线性降维方法,但是他对于异常点却十分敏感,这使得它在存在很多异常点的情况下,求得的解往往偏离我们想要的结果。而由于1一范数的鲁棒性,L1-PCA相对PCA,不易受异常点的影响。尽管L1-PCA相比较PCA更优,但是却也更难求解。关于L1-PCA问题的求解,存在很多算法,但是大多计算比较复杂,求解速度很慢。   本文主要研究了一个近似求解L1-PCA问题的快速的贪婪算法。首先从统计的角度来推导L1-PCA问题,并说明L1-PCA优于PCA的原因。接着介绍了几个L1-PCA的求解算法,主要对逐步降维算法和贪婪算法的思想进行了细致地分析。根据其中贪婪算法的一些缺陷,提出了该贪婪算法的两个修正算法,以及投影优化算法。最后通过实验分析了各个算法的优劣。  
其他文献
摘 要:随着石油化工、航天航空和城市供水供气等管道输送工程的不断发展,管道的市场需求加大。另外,空调、冰箱、热水器等生活必需品的应用,对不同材质和不同型号的管道、管件都有了更多的需要。因此,对于管道的加工工艺就提出了严格的要求。管件的一体化数控加工和控制,可以优化加工程序,提高自动化的程度,大幅度节省人力、物力在加工过程中的投入。本文针对管道一体化数控加工工艺与控制方案设计进行研究讨论。   关
露天煤矿的迫坡问题伴随煤矿的开采存在,随着开采境界和深度的不断延伸,边坡对煤矿的生产影响越来越突出,在生产过程中,须认真研究边坡问题,采取切实有效措施加以治理,预防滑
本文研究如下Hamilton系统周期解的存在性和唯一性:其中T0,F:R×RN→R关于t是T-周期的,而且满足下面的条件: (A)F(t,x)对每个x∈RN关于t是可测的,对a.e.t∈[0,T]关于x是可微的,
特征零代数闭域上Cartan型李超代数分为四类,分别为W,S,S以及H.本文主要研究其中三类S,S以及H的极大根阶化子代数.首先给出了它们的根集,进一步探究了它们的根阶化子代数与其Z-阶
作为一名从教多年的高中英语教师来讲,在与学生朝夕相处的日子里,我常常听到不少学生及家长抱怨说高中英语难学.中考120分怎么说也考了110分左右,高一刚入门怎么定语从句就无
期刊
本文首先利用临界点理论中的极小极大方法研究了一类带有次线性振动非线性项的两点边值问题无穷多个解的存在性,然后利用极小极大方法又研究了一类非自治二阶Hamilton系统无穷
本文主要研究关于Bloch群与K3群存在的关于regulator的一个交换图。首先在引言中介绍问题的背景。然后,第一章叙述证明所需要的基本概念和命题,包括Bloeh群与K3群的定义和一
禾技是世科姆公司开发的高效保护和治疗杀菌剂,对大姜茎基腐病、斑点病、炭疽病等病害有非常好的保护与治疗活性,同时具有明显的刺激生长、增加产量、提高品质、增强抗逆性等