基于协同过滤混合填充的个性化推荐方法研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:Eltonxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断普及,人们进入了信息社会和网络经济时代,从互联网上可以获取的信息量不计其数,但是有效的信息却是冰山一角。推荐系统的应运而生将用户与信息联系在一起,实现了从海量数据里为用户挖掘有意义的信息的功能。协同过滤作为主流的推荐算法,能够从用户对项目的评分记录中确定最近邻居集合,并按照最近邻居的评分记录分析出用户对项目的喜好。然而随着推荐系统中项目数量的不断增加,用户评价、浏览过的项目数量相对于项目总数而言微乎其微,导致推荐系统的数据稀疏性较高以致影响推荐性能。本文介绍了推荐系统的相关知识,阐述了协同过滤算法的推荐过程,并针对由于数据稀疏导致的协同过滤推荐结果精确度低、覆盖率低的问题展开了深入的研究,提出了两种方案加以改进。主要研究工作如下:1、本文提出了缓解数据稀疏问题的协同过滤混合填充算法(HFCF)。首先从物品角度出发,若用户对某一物品暂无评分,依照用户对其最近邻物品的评分预测可能评价给该物品的分值,并填充到稀疏矩阵中。同时从用户角度出发,利用填充后的矩阵确定目标用户的邻近用户,选取邻近用户共同评价过的数量最多的物品,结合邻近用户对这部分物品的评分与用户间相似度计算评分值从而进一步填充矩阵。该方法在不需要其他复杂信息的条件下,显著地缓解了数据稀疏问题,通过实验验证了该方法能有效地提高推荐的精确度。2、本文提出了基于约简后邻近用户信息填充的协同过滤算法(RNFCF)。首先,分析目标用户喜爱的物品所包含的属性,选取其中一部分属性,将同时具有这些属性的物品构成论域。其次,分析其他用户对论域中物品的喜爱程度,每个用户喜爱的全部物品组成一个子集,子集的集合构成论域上的一个覆盖,按照覆盖约简算法从邻近用户集中移除冗余用户。最后,根据保留下的邻近用户中相似度较高的部分用户的评分信息为目标用户预测评分,并填充到矩阵中。填充后进行协同过滤推荐,能够有效地降低数据稀疏等级。实验表明RNFCF有效地提高了推荐的覆盖率与准确度。
其他文献
从学科核心素养出发的高中政治教学,能够有效纠正传统教学中"重知识、重评价、轻素质"的应试教育倾向,促进教育本质的理性回归,使课堂专注于学生的问题解决、探究能力、批判
2004年7月1日施行的《行政许可法》在总结立法和实践经验的基础上,确立了我国的行政许可听证制度。《行政许可法》延续了《行政处罚法》的方式,以专节的形式对听证程序作出规
王羲之是东晋时期最富盛名的书法家,其书法兼善诸体,博取众长,终成一家。其书法成就主要体现在新体上,王羲之的楷书均为小楷,作为“今体”之一,在钟繇小楷的基础上,完备了楷
创新驱动发展及生态文明建设的战略契机下,绿色创新成为制造型企业提升竞争优势的重要选择。随着我国经济发展步入新常态,绿色发展理念成为社会共同行动,制造型企业转型升级
<正> 笔者自1983年至1989年应用大黄蒲黄地榆汤治疗上消化道出血(食道及胃底静脉曲张破裂出血例外)50例,并与抗血纤溶芳酸、止血敏、维生素k3联合治疗60例的疗效对比观察,报告
文学主题,根本上说是在特定区域的文化树上生长起来的。对于复仇主题这样与一个民族的文化习俗、人生情感及其情感表现方式紧密联系的重要主题,更是一个民族、一种文化的表现
我国的中小学生是祖国明天的主人,完善的道德教育维系着中国未来的命运。写字教学的德育功能不会是万能的,它是有限的,然而却是非常宝贵的,它不能代替别的德育功能,其他德育教育同
通过对我国台湾地区全民健康保险住院诊断关联群支付制度的核心内容进行深入研究,进一步探讨该制度的实施效果与存在问题,如制度设计缺乏财务风险补偿弹性和实施过渡期、配套
<正> 使用说明①本标准适用于天津市区级业余体校的入队选拔。各选材网点可根据选材对象的情况分别选用初选(一)或初选(二)的评价标准。②本标准采用计算总分的方法,各个专项
要成为真正的拔尖人才,一定是学生自身的努力和他的天赋相加,只有他的天赋被发现并且发掘出来,方可成大器,因此,发现并发展学生创造的潜能是我们教育的神圣使命,也是衡量我们