论文部分内容阅读
随着互联网的迅猛发展,信息爆炸式增长,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向。本文分析了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及两种在其基础上的改进算法,然后分别指出了三个算法中的错误和产生错误的原因。最后,我们给出了本文的改进算法,并通过模拟实验对几种不同的算法进行了对比。