论文部分内容阅读
用户在社会化标注系统中使用标签对资源进行标注,形成了用户、资源、标签之间的三元关系,作为联系用户与资源的纽带,标签不仅可以体现用户的兴趣偏好,还可以表示资源的内容特征,标签的相似性度量成为了基于标签的个性化推荐与标签聚类等标签应用的基础与核心。因此,如何利用用户、资源、标签之间的三元关系,设计有效的标签相似性指标,成为了一个主要问题。为此,本文结合国家自然科学基金项目:“泛在计算环境中社会化驱动的情境感知个性化信息服务研究”(项目编号:71471165),从用户标注行为的角度出发构建刻画用户、资源、标签之间的三元关系的标签超网络,据此,综合考虑标签超网络中同超边共现关系与超边共节点共现关系对标签相似性的影响,提出了一种基于超网络中共现关系的标签相似性评估方法,对标签相似性进行有效地度量。本文的主要工作和贡献如下: (1)构建了标签超网络。从用户标注行为出发,构建了可以清楚刻画社会化标注系统中用户、资源、标签之间的三元关系的标签超网络,并将其与标签共现网络进行对比分析。 (2)提出一套基于超网络中共现关系的标签相似性指标。将社交网络分析中的三元闭包原则与心理学领域的邻近联系法则引入标签超网络,综合考虑标签超网络中同超边共现关系与超边共节点共现关系对标签相似性的影响,设计了一套基于超网络中共现关系的标签相似性指标。 (3)展开实证分析。选取Last.fm与MovieLens这两个社会化标注平台中的数据,以标签谱聚类作为检验相似性指标的方法,利用无监督聚类中的内在评价指标轮廓系数对不同相似性指标开展对比评估,验证了基于超网络中共现关系的标签相似性指标的有效性。 研究表明,基于超网络中共现关系的标签相似性指标是有效的,在标签相似性关系的度量上,比基于超网络中同超边共现关系的标签相似性指标准确,研究结果对基于标签的个性化推荐与聚类具有较好的应用价值。