一种解决大规模数据集问题的核主成分分析算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:yuanpings
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种大规模数据集求解核主成分的计算方法.首先使用Gram矩阵生成一个Gram-power阵,根据线性代数的理论可知,新形成的矩阵和原先的Gram矩阵具有相同的特征向量.因此,可以把Gram矩阵的每一列看成核空间迭代算法的输入样本,这样,无须使用特征分解即可迭代地计算出核主成分.该算法的空间复杂度只有O(m);在大规模数据集的情况下,时间复杂度也降低为O(pkm).实验结果表明了所提出算法的有效性.更为重要的是,在大规模数据集的情况下,当传统的特征分解技术无法使用时,该方法仍然可以提取非线性特征.
其他文献
随着经济的快速发展.我区厂房、商住楼、道路、桥梁等建设项目也纷纷上马。在这些建设工地上辛苦劳作的建筑工人的饮食安全是我们工作的重中之重.近几年来.由于各个建筑工程建设
提供了一种采样并生成植物叶子表观的方法,可以非常真实地展现叶子秋季在干枯、老化过程中多种纹理、表观属性的变化.在生成叶子纹理的过程中,有别于以往基于单一材质样本的表观合成技术,采集了大量不同叶子样本表面的双向反射分布函数BRDF和双向透射分布函数BTDF,最终从这些数据中得到叶子衰老过程在老化空间中的表达式和完全分布图.结合植物学知识和所得到的老化空间中的表达式和分布图,可以很好地指导合成秋季不同
“环首都经济圈”建设目标是有效承接首都产业转移和功能分散,接受首都人才、技术、信息等高级要素的溢出。有效承接能力在很大程度上取决于“环首都经济圈”各个地区的技术吸
目的了解长春市儿童近年来健康状况,分析儿童营养性疾病变化趋势,为进一步做好儿童保健工作提供科学依据。方法回顾1999-2004年6年间长春市0-6岁儿童营养性疾病的状况。在儿童保
邹城市在2004年10月-2005年4月份组织开展了艾滋病防治资源评估调查工作,现报告如下。
针对网构软件行为中的不确定性和不完整性,提出了一种支持协商的网构软件体系结构行为建模与验证方法,在建模中,该方法借鉴了UML时序图元素表示法,并增加了建模元素支持行为的不
国际服务业转移涉及的行业越来越多,转移形式趋于多样化,并且日益深入到企业内部核心环节和过程。京、沪、深生产性服务业在吸引外商投资,提升生产性服务业承接国际转移水平等方
节约能量以提高网络寿命是传感器网络研究面临的重要挑战网内聚集查询在中间节点对数据进行预处理,可以减少消息传送的数量或者大小,从而实现能量的有效利用,但是,目前的聚集查询
针对无线传感器网络贪婪地理路由协议中的路由空洞问题,提出一种高效的基于路标迭代提取和剔除的自适应空洞处理算法.该算法中,当探测包贪婪转发遇到空洞时,在网络拓扑局部平面化
为了在移动ad hoc网络中有效利用无线信道资源,提出一种基于ID的信道预约(ID-based channel reservation,简称IDBCR)多址接入协议.该协议在公共信道上发送Request—To—Send/Clear-