论文部分内容阅读
在社交网络中,标签对资源的描述在一定程度上存在着准确性不高和结构紊乱等现象。为了改善这些问题,提出了一种新的基于权重与共现的标签凝聚型层次聚类算法:首先在社交网络中收集网页标签的相关数据,然后计算标签与网页的权重,再计算标签共现的相似度,并以此为初始数据进行凝聚型层次聚类,最后把聚类结果与人工分类结果比较,计算出精确度、召回率以及加权调和平均数F1。通过实验结果体现了这种算法的可行性。