论文部分内容阅读
随着信息技术的高速发展,人类已经逐步进入了一个万物互联的时代。各类信息的的数据量成指数级增长,传统的推荐算法在应对“信息过载”的问题上越来越捉襟见肘。在推荐算法的探究上,研究人员提出了各类混合推荐算法,希望通过借助更多的附加信息改善算法的推荐效果。其中,融合用户信任信息的推荐算法研究取得了长足的发展,SoReg、TCRec等有代表性的算法相继被提出。通过结合信任信息,TCRec等算法的推荐性能虽然得到了一定的改善,但算法的推荐性能仍有很大的提升空间。这是因为:(1)数据集中提供的社交信息过于稀疏,TCRec等算法中应用的信任因素对算法推荐性能提升贡献不大;(2)算法忽略了用户兴趣相似度的考量,仅仅根据数据集中社交信息选择用户簇成员,导致推荐效果不佳;(3)算法仅仅使用社交关系的出入度对信任关系进行定义,无法真实的反映用户间信任关系。本文围绕TCRec算法的不足点,提出两种改进的TCRec算法:I-TCRec算法和TSCRec算法,并基于公开数据集对算法进行了评估。本文主要工作和贡献有以下两点:(1)本文对TCRec算法进行改进,提出了 I-TCRec算法。为了在无社交关系数据集中考虑用户信任关系,算法利用了一种融合用户熵差和隐式用户信任度的综合用户信任度计算方法。综合用户信任度考虑用户间的共同评分项,可以对算法中用户簇成员进行更精准的选择,减少出现高信任度低兴趣相似度的情况。同时算法也提出了一种全局用户信任度的计算方法,更好的对信任簇特征进行描述。实验表明,I-TCRec算法性能相较于传统的推荐算法在评分预测准确度方面取得了提升,证明了该算法的性能。(2)本文提出了另一种改进算法TSCRec算法,算法利用数据集中提供的用户社交信息和I-TCRec算法中的综合用户信任度,定义另一种用户信任度的计算方法,该方法大大降低了信任信息的稀疏度。为了计算用户簇成员,算法使用用户节点和项目节点,构造二分图,并利用用户间关系和用户与项目间关系定义节点间的权重,通过改进的PersonalRank随机游走算法,计算目标用户的用户簇成员。实验表明,在评分预测准确度方面,TSCRec算法的性能相较于几种基于社交网络的推荐对比算法得到了提升,证明了该算法的性能。