论文部分内容阅读
随着科学技术的发展和互联网的出现,大量的信息涌入我们的生活,出现了“信息爆炸”这一现象,信息过载和垃圾信息等问题也随之出现,推荐系统为了解决这一问题而出现。用户的兴趣爱好及行为特征有一定的模式特征,推荐系统便是挖掘其中的模式来对用户进行推荐。在推荐系统中,协同过滤算法是目前应用最多、效果也最好的。协同过滤通过分析用户或信息的近邻对用户进行推荐。但是协同过滤系统目前还受到冷启动和数据稀疏的影响,因此本文结合隐式反馈、标签信息以及信任机制对其进行了改进,在一定程度上减轻了上述问题。以下是本文的主要工作及改进之处:1.研究了用户之间的信任关系对推荐结果的影响,使用用户之间的信任信息解决了用户自身信息不足、正反馈偏好不确定的问题,同时使用隐式反馈信息缓解了数据稀疏这一问题,改进了PPMF(PairWise Probabilistic Matrix Factorization)模型,给出了T-PPMF(Turst-PairWise Probabilistic Matrix Factorization)模型,之后引入信任用户之间的近邻关系,设计了一种改进后的NT-PPMF(Neighbor Trust-PairWise Probabilistic Matrix Factorization)模型,实验结果证明改进后的算法能提升原有算法的正确率,且收敛速度也更快。2.研究了推荐系统中的“托攻击组”行为。首先将进行托攻击的用户组和被攻击的项目划分出来,形成一个“攻击块”,之后通过分析“攻击块”的行为特征和正常用户块行为特征的区别,提出了ADFI(Average Deviation of Attack User to Fill Items)和UARD(Under Attack Items Average Rate Deviation)两个指标来将真正的攻击块辨别出来。之后参考频繁项集挖掘算法设计了一种新的剪枝算法来挖掘出“疑似攻击块”。最后的实验结果也说明了我们的算法能有效的甄别出“攻击块”。3.设计了一种基于用户组-项目-项目标签三部图扩散的音乐群组推荐算法。根据假设:用户在网络中的行为都是由其爱好决定的,而其爱好又分布在项目空间中。其中设计的群组爱好既考虑群组用户的平均情况,又考虑了群组用户之间的差异性,之后使用户爱好在三部图上传播,最后对目标群组生成推荐。实验结果证明我们的算法能得到更好的实验结果,并缓解了数据稀疏问题。