【摘 要】
:
针对传统K-means算法在处理海量数据时存在计算效率低和时间复杂度高的缺点,提出一种基于Spark计算框架的改进K-means算法。利用网格单元保存数据点的空间位置信息,通过与聚
【机 构】
:
天津理工大学智能计算及软件新技术天津市重点实验室
【基金项目】
:
国家自然科学基金项目(61571328),天津市自然科学基金项目(15JCTPJC60100),天津市普通高等学校本科教学质量与教学改革研究计划基金项目(171006008F)
论文部分内容阅读
针对传统K-means算法在处理海量数据时存在计算效率低和时间复杂度高的缺点,提出一种基于Spark计算框架的改进K-means算法。利用网格单元保存数据点的空间位置信息,通过与聚类中心的空间位置关系减少冗余计算,为提高算法处理海量数据的能力,采用Spark框架对算法进行并行化实现。在集群环境下进行测试,基于Spark框架的改进后算法能有效降低计算的时间复杂度,算法具有良好扩展性,计算效率有显著提高。
其他文献
采用配位一沉淀法制备了Ag3PO4可见光催化剂。对催化剂分别进行了SEM、XRD和UV-vis表征,并对其在可见光下降解有机染料的性能进行测试。结果表明:所制备的Ag3PO4为立方体形,结晶
针对传统聚类算法直接应用于分段时间序列聚类效果不佳,提出一种基于DTW距离度量的层次聚类算法。在计算距离矩阵时,运用DTW计算分段之间的距离取代传统的欧氏距离度量方式,
包装设计是选用合适的包装材料和各种工艺手段对商品进行容器、结构和包装的装饰美化的设计。随着经济全球化的进一步加剧和网络的普及,各种新观念、新工艺、新材料的出现,人们
社区检测是研究网络结构的基础,在分析现有机会网络社区检测算法的基础上,提出一种改进的基于记忆的认知启发社区检测方法IMBC。节点通过记录与其它节点的历史接触信息,计算
本文通过简要介绍建筑施工中外墙体保温材料的选择,以及简要说明了建筑外墙体保温的分类,进而探讨了建筑施工外墙的措施和质量控制的方法,以更好提高建筑外墙体的保温技术,满足人
将社会责任引入到上市公司理财目标的确定中已经受到学者们的认可,但是当前只有少数公司在确定理财目标的同时考虑了社会责任。本文将社会责任融入到公司理财目标的确定之中,分