论文部分内容阅读
针对划分聚类算法对初始中心较为敏感的缺陷,提出了一种新的热点话题检测方法。首先,为了降低语义表达形式带来的误差,采用结合语义相似度的TF-IDF函数计算特征权重;然后,用AGNES算法进行聚类,得到初始聚类中心,再用K-means算法聚类出最终结果;最后,分析微博的转发数和评论数对热度的影响,计算话题热度并对结果进行排序。通过实验验证了新方法的有效性。