论文部分内容阅读
为更好地适应Web搜索结果聚类的客观性要求,提出了一种基于熵的自适应搜索结果聚类方法。为此,该方法首先运用投票机制确定聚类中心,再引入信息熵来自动确定聚类数目,使聚类结果更客观真实。同时,采用了改进的多方位加权函数权值计算方法,预处理过程中采用了合并词形成短语的方法束弥补分词软件的不足,以进一步提高聚类效果。实验表明新方法是可行有效的。