基于随机投影的K-means算法研究

来源 :信息技术与网络安全 | 被引量 : 0次 | 上传用户:silent_snake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于大量的高维训练数据,数据降维是提高存储和计算效率、避免维数灾难的有效手段。提出了一种方法:首先基于随机投影理论对原始数据集进行随机投影变换,将数据集矩阵A映射为ā,而后再对矩阵ā执行K-means聚类算法,这样不仅能降低数据集的维度,同时也能减少执行K-means算法的时间,并且能够保证良好的聚类效果。最后在人工数据集和面部图像数据集上的仿真实验验证了该理论的有效性和准确性。
其他文献
本文在数字化审计优势分析的基础上,提出数字化审计团队组建和作业流程方面的应用探索,并以电网企业业扩时限审计为例进行具体分析。
随着英语在全球的发展与传播,越来越多的学者呼吁调整现行英语教育,以适应目前英语国际语的现状。其中,经常被提及的一个英语教育改革就是要加强学生对现有各英语变体的接触
在类亲情交换概念的基础上,本文从现实中的三类企业入手,回答类亲情交换关系是如何在中国组织中形成和发展演化的。首先,通过对中国文化背景下社会化生活方式与西方的差异分
目的:分析结节性甲状腺肿声像图特征,并进行超声分型,旨在提高对结节性甲状腺肿的诊断准确率尤其是甲状腺内单发结节的诊断.方法:对49例结节性甲状腺肿声像图特征与病理对照
在当前我国茶文化产业内涵不断朝向茶文化产品和服务等衍生品拓展价值的过程中,加强对经典茶文化书法作品的翻译创新具有重要的历史动因,包括:一是茶文化产业的供给侧改革要求
阐述了在集中生活热水供应系统中设置毛巾干燥器的作用,分析了毛巾干燥器的设置方式,讨论了毛巾干燥器的设计计算方法.
共享民宿作为新兴的研究领域,获得了学者的广泛关注。与传统的酒店相比,共享民宿不仅为消费者提供了不同风格的房间,也为消费者提供了个性化的服务和体验当地文化的机会。针
设(X,Y)是F×R上的随机对,其中F为可分的半度量空间.基于广泛应用背景,本文研究的是回归函数r(x)=E[Y|X=x]的最近k-邻域核估计函数r n(x)的收敛问题.通过运用随机投影的方法,
现阶段我国高等教育已由规模扩张转向内涵发展,随着人口出生率的降低和入学适龄人口的减少,大学之间的生源竞争将会更加激烈,探讨构建实践教学的保障体系、提高人才培养的市场竞
为了编制适用于大学生参与社会活动的量表,本文对300名大学生数据进行探索性因素分析和对149名大学生数据进行验证性因素分析,结果表明大学生社会活动参与量表由4个维度组成,