基于矩阵分解的推荐算法研究

来源 :太原理工大学 | 被引量 : 2次 | 上传用户:inKin9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务迅速发展,各类信息商品网站数量剧增,用户往往需要耗费大量时间筛选自己喜欢的商品或者感兴趣的资讯。推荐系统收集用户在网站的历史行为数据比如用户在天猫网站上面的购物行为数据、在网易新闻app中对一条资讯的点赞行为数据,然后进行推荐算法的训练得出针对特定用户的推荐商品列表或者推荐资讯列表来满足用户的个性化需求。个性化推荐系统并不是简单统计出热门商品或者热点资讯而是针对每个用户的不同兴趣推送出不一样的结果,个性化推荐算法无论在学术界还是工业界都是一个热点研究问题。推荐算法可以分为分数预测算法和项目排序算法,分数预测问题中一般情况下用户有明确的反馈行为比如用户在豆瓣电影评分网站上对喜爱的电影打高分,不喜欢的电影打低分。项目排序问题中用户点击一条新闻并没有评分行为或者点赞行为,系统中只存在正样本,其他样本是负样本和缺失值的混合。早期经典的推荐算法有基于内存的协同过滤算法,基于内容的算法,混合推荐算法。协同过滤算法思想通俗易懂,操作简便,可以做到个性化推荐,但是容易受到数据稀疏的影响。基于内容的算法只关注一个用户感兴趣项目的属性,可以解决项目冷启动问题,不过推荐结果单一,难以发现用户潜在需求产品,混合推荐算法综合使用多个算法的优点应对复杂的推荐场景,推荐结果是多个算法推荐结果的总和。上述算法都容易受到数据稀疏的影响,于是有学者提出矩阵分解模型,在稀疏数据集上有较好的表现,利用机器学习方法更新参数更加精确地量化用户品味和商品属性,大大地提高了推荐算法准确率。仅仅使用评分矩阵作为数据源已经不能满足推荐精度的要求,有的学者挖掘全局项目相似度关系,有的研究者提出利用异构辅助信息,比如社交网络关系。用户在社交网络上面与他人的信任关系可以帮助模型捕捉用户的需求和爱好。分数预测问题中协同过滤是经典的推荐算法,但在稀疏数据集上表现很差,其原因在于稀疏数据集中很多商品之间的相似度无法计算。本文融合全局项目相似度信息与社交网络关系信息,重点分析社交好友的相似度,深度分析社交网络信任值的可靠度提出fiss算法。在filmtrust电影数据集和豆瓣数据集上的多组实验证明fiss算法相比较其他社交网络算法误差更小。相对排序问题中Pairwise方法精确度最高,对数据集所有数据采用最大后验概率估计得到最小极值目标函数也就是损失函数。本文在项目排序问题上提出一种利用全局项目相似度和贝叶斯个性化排序框架的算法FSBPR,FSBPR对于正样本和负样本赋予不同的权重提高了推荐准确率。在filmtrust数据集和ml100k数据集上的多组实验证明FSBPR算法相比较其他项目排序推荐算法召回率指标更高。
其他文献
莫扎特《A大调单簧管协奏曲》(K622)是为当时维也纳宫廷乐队的单簧管演奏大师斯塔德勒而作,因此又叫做斯塔德勒协奏曲。此曲作于1791年10月,是莫扎特逝世前不到两个月时候的
牦牛乳是一种天然的浓缩乳,其乳中的脂肪、蛋白质、乳糖、干物质等含量均高于其他牛乳,是加工奶油系列制品的最优原料乳之一。文章对甘肃天祝白牦牛和甘南牦牛乳的物理特性和
<正>粮食是人类生存的基础,粮食企业在市场经济中占有十分关键的地位,因此粮食企业财务会计工作也必须高度重视。《粮食企业会计实务》是针对粮食企业开展财务会计工作进行研
对垂体依赖性综合征一库兴氏病,早期通常采用肾上腺次全切除术,几乎所有的病人都迅速好转,但也有的病人复发,多数病例都需要类固醇替代治疗,因此,治疗又倾向双侧肾上腺全切
【正】 今年是文学研究会成立七十周年,冰心先生是一百七十二位会员中四位目前依然健在的会员之一。借这个机会,从文学研究会的角度研究冰心先生,大概是一个相当好的题目。大
[目的/意义]旨在为高校网站建设提供参考。[方法/过程]运用链接分析法,以西南地区13所“双一流”建设高校的官方网站为研究对象,通过谷歌搜索引擎收集高校网站的链接及互链数
许多耳科疾病与耳蜗的缺血/再灌注损伤有关,目前认为耳蜗的缺血/再灌注损伤与谷氨酸毒性、自由基的激活、一氧化氮的作用等有关。针对这些机制的研究主要集中于谷氨酸受体拮
目的 通过观察强骨胶囊对骨质疏松大鼠骨代谢的影响,探讨此制剂治疗肝肾不足型骨质疏松症的治疗效果及作用机理,深化对骨质疏松症的中医病机认识,并为强骨胶囊的临床运用和进
本文试图把任务分析的理论和技术引入我国的物理教学中,使我国的物理教学更加符合学与教的规律。 在本文的第一章中,首先介绍任务分析的起源、定义;接下来讨论了两种适合课堂