论文部分内容阅读
随着电子商务迅速发展,各类信息商品网站数量剧增,用户往往需要耗费大量时间筛选自己喜欢的商品或者感兴趣的资讯。推荐系统收集用户在网站的历史行为数据比如用户在天猫网站上面的购物行为数据、在网易新闻app中对一条资讯的点赞行为数据,然后进行推荐算法的训练得出针对特定用户的推荐商品列表或者推荐资讯列表来满足用户的个性化需求。个性化推荐系统并不是简单统计出热门商品或者热点资讯而是针对每个用户的不同兴趣推送出不一样的结果,个性化推荐算法无论在学术界还是工业界都是一个热点研究问题。推荐算法可以分为分数预测算法和项目排序算法,分数预测问题中一般情况下用户有明确的反馈行为比如用户在豆瓣电影评分网站上对喜爱的电影打高分,不喜欢的电影打低分。项目排序问题中用户点击一条新闻并没有评分行为或者点赞行为,系统中只存在正样本,其他样本是负样本和缺失值的混合。早期经典的推荐算法有基于内存的协同过滤算法,基于内容的算法,混合推荐算法。协同过滤算法思想通俗易懂,操作简便,可以做到个性化推荐,但是容易受到数据稀疏的影响。基于内容的算法只关注一个用户感兴趣项目的属性,可以解决项目冷启动问题,不过推荐结果单一,难以发现用户潜在需求产品,混合推荐算法综合使用多个算法的优点应对复杂的推荐场景,推荐结果是多个算法推荐结果的总和。上述算法都容易受到数据稀疏的影响,于是有学者提出矩阵分解模型,在稀疏数据集上有较好的表现,利用机器学习方法更新参数更加精确地量化用户品味和商品属性,大大地提高了推荐算法准确率。仅仅使用评分矩阵作为数据源已经不能满足推荐精度的要求,有的学者挖掘全局项目相似度关系,有的研究者提出利用异构辅助信息,比如社交网络关系。用户在社交网络上面与他人的信任关系可以帮助模型捕捉用户的需求和爱好。分数预测问题中协同过滤是经典的推荐算法,但在稀疏数据集上表现很差,其原因在于稀疏数据集中很多商品之间的相似度无法计算。本文融合全局项目相似度信息与社交网络关系信息,重点分析社交好友的相似度,深度分析社交网络信任值的可靠度提出fiss算法。在filmtrust电影数据集和豆瓣数据集上的多组实验证明fiss算法相比较其他社交网络算法误差更小。相对排序问题中Pairwise方法精确度最高,对数据集所有数据采用最大后验概率估计得到最小极值目标函数也就是损失函数。本文在项目排序问题上提出一种利用全局项目相似度和贝叶斯个性化排序框架的算法FSBPR,FSBPR对于正样本和负样本赋予不同的权重提高了推荐准确率。在filmtrust数据集和ml100k数据集上的多组实验证明FSBPR算法相比较其他项目排序推荐算法召回率指标更高。