论文部分内容阅读
为了得到准确有效的用户聚类,提出了一种基于关键字的用户聚类算法。该算法是在传统Rock算法的基础上进行了改进,提出了相似权重和平均邻居的概念,并且将用户关键字事务集的平均邻居数定义为用户访问模式相似性的标准。在不产生离群用户点的基础上,缩小了用户聚类的范围,将一个大的用户聚类更加精确的划分为几个小的用户聚类。利用用户之间的相似度阈值对数据进行过滤,减小了用户聚类的计算量。经过实验验证该算法有效的提高了相似用户聚类的准确性和运行效率。