论文部分内容阅读
随着Web2.0、移动互联网等技术的崛起,人们获取信息的方式发生了巨大的改变,信息化已经日益深入。互联网上的信息迅速增长,人们进入了大数据时代。对于信息消费者而言,如何在海量的信息数据中找到自己感兴趣的、对自己有价值的信息变得越来越困难,另一方面也让网络中大量的信息无人问津变成长尾沉默使信息利用率降低。在此需求的推动下,推荐系统应用而生[1],它可以通过分析用户历史行为数据,运用数据挖掘的相关技术预测用户的兴趣爱好,主动向用户推送信息。目前推荐系统已被广泛应用于各个领域。此外,近几年社交网络发展十分迅速,它将现实生活中的人们通过网络联系在一起。人们可以在网络上交换信息,将这些信息应用到推荐过程中,在很大程度上弥补推荐算法的不足。本文充分挖掘社会网络中用户之间的关系,结合传统推荐算法预测用户对服务项目的评分,提高推荐的质量和可靠性。本文的主要研究工作如下:(1)在用户评分数据极端稀疏的情况下,传统的用户相似度计算方法存在弊端,导致推荐系统的推荐质量急剧下降。本文使用局部相似度的概念,引入重叠度因子修正用户局部相似度,然后将修正的局部相似度相加得到用户全局相似度。改进的用户相似度算法避免了传统方法中共同评分项目数据稀少但评分非常相似、用户相似度较高的不合理现象。(2)传统协同过滤算法将用户间的相似度作为最终权重,生成邻居用户,没有考虑到用户间的信任关系对推荐结果的影响,本文认为用户间的信任关系也可以作为推荐的权重,生成邻居用户进而进行推荐。针对传统协同过滤算法中存在的数据稀疏性问题,本文提出了信任关系传递规则,在一定程度上缓解了上述问题。(3)传统的协同过滤算法仅仅依靠用户-项目评分数据进行推荐,没有考虑到用户评分信息过期的问题,越早的评分信息价值越低,越晚的评分信息价值越高。为了更准确的对未评分项目进行预测,本文在评分预测阶段引入时间权重函数,以此来提高推荐的质量。最后,为了验证本文提出的融合信任关系的协同过滤算法(STCF)的有效性,采用MovieLens数据集进行仿真实验,实验的结果表明本文提出的算法比传统的协同过滤算法准确度更高。