论文部分内容阅读
近些年,随着信息技术的不断进步,人们获取数据的手段日新月异,不少企业和机构已经存储了大量的数据。基于数据的急速增长,大规模数据集高效数据挖掘技术的应用需求快速增加,本文主要以聚类算法为例,具体分析了主流的BIRCH算法在大规模数据集中的应用局限性及其改进,将CLUK聚类算法应用于大规模数据集高效数据挖掘,并获得了较好的效果。