论文部分内容阅读
随着Web2.0技术的发展,社会标注系统日渐流行起来,使得标签在用户收藏的检索和分类管理等方面得到了广泛的应用。然而,由于用户使用标签的自由、非控制性,导致标签在使用上存在冗余和语义模糊性。为了处理该问题,提出一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的标签语义挖掘算法,通过对用户的标注数据进行非负矩阵分解,得到一个包含一系列语义相关标签基的标签子空间,使得同义及相关的标签聚合于同一标签基,且一词多义的标签归类到语义不同的标签基,从而实现标签语义的近