论文部分内容阅读
提出了一种搜索引擎中基于无向图的聚类算法。算法先根据返回网页的相关信息计算网页间的相似性,再将检索结果及其相似性关系映射为无向图,然后从图中随机选取几个点作为初时质心,依次计算剩余点与质心的相似度,根据其与阀值的关系决定是否将其加入某个簇,直至加入全部的点,从而将返回结果组织为有限的几类,提高用户检索信息的效率。理论分析表明,提出的聚类算法在一定程度上解决了文档多义性问题及孤立点问题。
实验结果也表明,所提的聚类算法具有较好的效果,能有效聚类返回结果。