论文部分内容阅读
随着微博、微信等社交工具的普及,每个人都成为了社交网络信息的发布者及传播者,这些社交服务也因此积累了大量用户产生的数据信息,其中包括用户的个人档案、社交关系、文本内容等。大量的用户数据不仅成为工业界进行大数据分析,从而认识用户、了解用户的重要信息来源,同时也为学术界的研究工作提供了充分的数据支持。但不容忽视的是社交工具给人们生活带来便利的同时,网络中的信息过载问题也随之日趋严重。面对海量的信息,人们很难从中即时发现自己真正感兴趣的内容,因此,个性化推荐系统便作为一种有效的解决手段在各类社交网站中得到应用。本文针对微博用户数量急剧增长的问题,利用用户发布的博文内容及已存在的关注关系为用户推荐潜在的好友。具体研究内容和结论如下:(1)基于用户博文主题及网络结构信息的好友推荐方法由于人们在书写用户属性信息时的随意性和虚假性,使得在进行用户兴趣建模时用户属性无法得到有效利用。针对该问题,本文提出了一种基于兴趣偏好和网络结构的混合好友推荐方法。首先采用LDA主题模型对用户微博进行建模,从中挖掘用户兴趣,并依据同质性原理对目标用户兴趣进行修正。同时,采用一种新颖的基于网络结构的预测指标度量用户间的亲密程度。实验结果表明,与仅利用网络结构的推荐效果相比,加入用户兴趣后的模型在准确率及AUC指标上有显著提升,同时也可提高部分博文主题不明确用户的兴趣挖掘效果。(2)基于改进Link-LDA的用户兴趣挖掘方法LDA主题模型仅仅利用文本内容挖掘用户兴趣分布而忽略了已存在的好友关注信息。针对该问题,本文放弃了传统的LDA而借鉴一种新颖的Link-LDA模型,并对其进行一定改进使其能够更好地适应社交网络上用户兴趣的挖掘工作。实验结果表明,这种新颖的兴趣挖掘算法可以更加有效地刻画用户对不同主题的偏好程度,并在好友推荐任务中取得更加精准的推荐效果。(3)微博好友推荐系统的设计与实现采用B/S架构,spring-MVC设计框架,设计一款微博好友推荐系统。该系统模拟了真实的社交网络,并根据本文提出的推荐算法为用户推荐新的好友,同时将推荐结果及相关推荐解释展现在好友推荐模块中。