论文部分内容阅读
聚类分析是数据挖掘中的一个重要研究领域。它将数据对象分组成为若干个类或簇,使得在同一个簇中的对象比较相似,而不同簇中的对象差别很大。K-means算法对随机选取K个初始点作为初始值是很敏感的,这将导致得到一个不合理的聚类结果,因此聚类的质量依赖于初始值。一方面论文提出了一种有效的改进方法,通过试验证明了改进算法的有效性;另一方面将该改进算法应用到对学生学习成绩的分析中,实践证明算法是可行的。