求解稀疏主成分分析问题的快速算法研究

来源 :福州大学 | 被引量 : 1次 | 上传用户:marquise
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息呈爆炸式增长的现代,大数据的应用研究已经成为一个热门领域,数据冗余是大数据背景下后台数据分析面临的一大难题.稀疏主成分分析(Sparse Principal Component Analysis,简记为SPCA)作为高维数据降维的有效方法,是解决这个难题的一种途径,在机器学习、图像分割、自动翻译、数据挖掘、模式识别与基因表达数据分析等领域得到了广泛应用.因此,研究求解SPCA问题快速算法具有十分重要的意义.近年来,SPCA模型和算法吸引了众多学者的目光,取得了丰富的研究成果.本文依据SPCA优化模型的特征,从矩阵特征值问题着手,研究设计求解SPCA优化模型的分裂算法,得到如下结果:首先,本文设计了一种求解正交约束优化问题的快速算法.正交约束是主成分分析和特征值问题所具备的共同特征.正交约束的非凸性给算法设计与分析带来了巨大的挑战.为此,本文提出了一种投影梯度算法,该算法采用施密特标准正交化方法处理正交约束(可视为在约束集上的投影运算).将算法应用于矩阵特征值问题,其时间复杂度为O(r2n)(其中r为矩阵的秩).当r<<n时,该算法的复杂度比经典的SVD算法复杂度O(n3)有明显改进,数值实验结果表明这种算法具有速度快,精确度高,且实现简单等特点.其次,本文依据SPCA优化模型的结构特性,设计了一种求解SPCA优化问题的交替投影算法.该算法将原问题分裂成两个子问题,并采用交替投影算法对两个子问题进行非精确求解.通过适当选择参数,数值实验结果充分说明了算法的有效性.本文针对SPCA优化模型的两个主要问题:正交约束与稀疏性,提出一种可能的解决途径.从数值性能方面展示了所设计快速算法的有效性.算法的理论收敛研究具有较大的挑战性,将作为后续研究的主要目标.
其他文献
【目的】研究噻虫嗪与氯虫苯甲酰胺两种药剂,对非靶标害虫土耳其斯坦叶螨生长发育及种群参数的影响。【方法】采用玻片浸渍法、叶碟法,研究土耳其斯坦叶螨对两种药剂的敏感性
煤矿机电设备管理是煤矿井下作业的重要部分,在煤矿机电管理中起到很重要的作用,随着煤矿资源需求量的不断增加,对我国煤矿资源的开采要求有更高的要求,若煤矿机电设备在运行中出
在新课改的新形势下.教师做好备课工作是大幅度提高学生成绩的中心环节。本文从做好集体备课前的准备、集体备课的研讨和落实、做好二次备课等方面,探究高中语文集体备课与二次
白血病细胞起源、免疫学及分子生物学特征;患者年龄及其与药物代谢相关的基因多态性;药效动力学及药物间的相互作用;白血病细胞逗留的骨髓微环境。这些因素及决定这些因素的
目的探讨急性脑梗死患者血清钾离子和血清镁离子水平变化及其临床意义,为患者的临床治疗提供参考。方法选择该院2014年3月至2016年3月入院治疗的急性脑梗死患者100例作为研究
介绍了AP1000、M310与VVER核电机组乏燃料水池冷却系统的设计特点,分析了这三种堆型的乏池冷却系统的主要差异,并从工艺角度对这三类机组乏燃料水池冷却系统的改进提出了合理
毒素战剂是重要的生物战剂之一,其最大的威胁来自它的高毒性和缺乏有效的防治手段。在毒素战剂中,肉毒毒素、志贺毒素、蓖麻毒素、相思子毒素等属于致死性生物战剂,葡萄球菌肠毒
《水浒》是以众多男性为其描写和塑造核心的,讲述的是封建男权视角下男人的故事。而如果我们将这样构建故事的原因仅归结为作者施耐庵的封建男权意识.或者由于话本小说成书过程
台州的产业集群可谓是遍地开花,如黄岩区的模具业,路桥区的塑料产品.温岭市的制鞋业,仙居县的工艺品,临海市的眼镜业,椒江区的缝纫机等,正是这些不起眼的草根经济,创造了一个又一个的
结合某出口小型发电厂项目,论述了反渗透和EDI在小型水处理系统中的实际应用,并与传统离子交换工艺进行了综合比较。