论文部分内容阅读
好友推荐作为推荐系统一个核心服务,在增加用户粘性和拓展用户社交圈上起着决定性作用。现有的推荐算法大部分关注节点之间的属性和联系强度,少有从全局出发考虑社交圈对好友推荐的影响。同时,现有的根据社交网络拓扑的推荐偏重于推荐认识的用户而忽略潜在感兴趣的用户,根据兴趣的推荐偏重于推荐陌生用户,难以得到用户信任。这两种推荐都未考虑到用户社交网络行为,极大影响了推荐结果的准确性、可靠性和全面性。其次,社交网络数据格式复杂多变,一种推荐算法不能解决所有场景下的推荐。针对以上问题,本文进行了如下研究:1.本文设计一种基于社交圈划分的好友推荐模型。该模型适用于社团特征明显、用户标签密集的数据集。首先,根据用户标签相似度计算出用户之间边的权值,将此权值融合到Fast Unfolding社团发现算法中。然后,利用好友分布情况的相似程度,计算同一个社交圈中任意两个用户的相似度,并按照相似度从高到低进行排序,产生top-N推荐列表。2.本文设计一种融合置信度的好友推荐模型。首先,构建一种融合相似度的计算方法。根据社交网络中节点的共同关注用户计算出用户社交相似度。基于TF-IDF算法思想提取用户关键词,计算出关键词权重向量,以此表示用户兴趣,并计算出用户兴趣相似度。通过实验找到最佳的融合参数,计算出社交和兴趣两个维度的融合相似度。其后,设计一种置信度计算方法,该方法综合考虑用户社交网络拓扑和社交网络行为。利用共同邻居数量占用户邻居总数的比例计算出关系置信因子,根据用户在社交网络中的互动行为计算用户的行为置信因子,融合关系置信因子和行为置信因子得到用户置信度。最后,利用置信度对融合相似度进行修正,使推荐结果具有更高的可信性和准确率。本论文通过新浪微博数据集进行实验,实验结果表明基于社交圈划分的好友推荐模型能够优化社团划分结果,在用户标签密集而其他数据稀疏的情况下能产生良好推荐结果。融合置信度的好友推荐模型在标签稀疏的数据集上能产生良好的推荐结果。