论文部分内容阅读
网页的内容信息对于提高聚类质量来说并不完全够用,针对网络社区网页之间存在的天然链接关系,本文提出了一种挖掘用户标签的增强型社区网页聚类算法。本文采用多种距离度量方法,并将网页之间的链接关系挖掘出来,包括相同用户链接,相同标签链接和相同用户相同标签链接信息,然后将社区网页的内容信息相似度和社区网页的链接关系结合起来判断社区网页所属的类别。实验表明,提出的算法是有效的。