融合用户兴趣偏好的混合协同过滤算法研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:lialianing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络技术的高速发展以及“个性化”思想的提出,传统的推荐系统已无法满足人们的需求,各大电商平台为抢占先机,纷纷推出自己的个性化推荐系统。个性化推荐系统,顾名思义,就是通过挖掘用户信息,针对不同的用户,返回因人而异的结果列表。但是,在现实生活中,出于隐私保护的问题,这些推荐系统往往无法获得用户的过多信息,从而也很难实现真正意义上的个性化推荐。如何从仅有的一些信息中挖掘出用户的真实搜索意图,一直是个性化推荐系统研究的热点和难点。目前,个性化推荐系统广泛使用的是协同过滤算法,这种算法虽然在一定程度上能起到个性化的效果,但是在面对现实生活中普遍存在的长尾现象(大多数的数据信息集中在少数用户和项目中)时,通常很难达到预期。本文针对协同过滤算法中评分数目分布不均的问题展开研究,提出了两点改进之处。首先,在计算用户相似度时引入了用户的兴趣偏好,并且在寻找最近邻时采用分布寻找的方法,即设定两个相似性阈值,根据阈值选择最近邻。然后,在评分预测中,通过填充评分矩阵中长尾项目的评分,来弥补评分数据不足带来的推荐误差。算法具体内容如下:(1)针对用户评分数据分布不均的问题,提出了融合用户兴趣偏好的近邻选择协同过滤算法。首先根据用户评分项目的标签,利用TF-IDF的思想,计算用户对标签的兴趣度,构建用户的兴趣偏好向量,从而计算用户在兴趣上的相似性;然后通过设定合适的相似性因子,计算用户在兴趣和评分上的综合相似性;最后根据综合相似性和评分相似性设定合适阈值,选择综合相似性大于设定值,并且评分相似性也大于设定值的用户作为当前用户的严格近邻用户,从而进行评分预测,根据评分将项目推荐给用户。(2)针对大多数项目只有少数评分的情况,对融合用户兴趣偏好的近邻选择协同过滤算法进一步改进,提出了一种常规项目和长尾项目的混合协同过滤算法。在该方法中,首先根据用户和项目的评分数量,将用户划分为活跃用户和不活跃用户,项目划分为常规项目和长尾项目;然后对于常规项目采用融合用户兴趣偏好的近邻选择协同过滤算进行评分预测,对于长尾项目则是先通过预测活跃用户对长尾项目的评分,用于填充评分矩阵中的缺失值,然后再预测长尾项目的评分;最后合并常规项目和长尾项目的评分进行推荐。最后,文中对上述算法进行了实验分析比较。
其他文献
在前些日子里,在火车上,在轮船中,在茶余饭后,常听人们谈论国是,关心国事,听得一些“议论”:“我们国家社会稳定,市场繁荣,经济飞速发展,人民安居乐业,大好形势来之不易。”
20世纪70年代以来,衍生金融工具在国际金融市场上大量涌现,对财务会计的理论核心提出了全面的挑战,引起了国际会计界的高度重视。随着我国加入WTO,逐步放松金融管制,完善资本市场,
在数学教学中数感具有重大影响力,数感的学习既可以强化学生对数学概念理解,又可以提高学生对数字化运算、数量间的相互转换等方面的理解及应用水平。学生在数感教学建立的基
桑葚,桑科桑属植物桑树(Morus alba L.)的果实,在具有良好的风味的同时,又具有极高的营养价值和药用价值。多糖作为桑葚主要活性物质之一,备受关注。桑葚多糖具备多种生物活性,由于其卓越的抗氧化能力受到中外研究者青睐。目前对于桑葚多糖的研究主要集中在多糖的结构表征及理化性质,尚未见到桑葚多糖在缓解结肠炎方面的研究,不利于桑葚多糖在新药和功能性食品领域的发展。本研究首先采用不同提取方法及粒度辅
社会主义集体主义原则与资产阶级个人主义是完全对立的。要提倡和实行社会主义集体主义原则,必须坚决反对资产阶级个人主义。这就要求我们对资产阶级个人主义的本质、历史发
每个做父母的都想给孩子一份终生受益的礼物。这礼物该是什么呢?是金银财宝、丰厚家产还是自立于社会的能力?回答自然是后者。陶行知写道:“滴自己的汗,吃自己的饭,自己的事
中国现代散文诗的结构状态,正经历着从线型向网络型发展。中国传统的审美观念,大抵呈一种线型倾向,构思轨迹单纯、明晰、确定;就象人们所喜闻乐见的民乐,旋律清晰、鲜明而流
学习和发展离不开活动,活动是幼儿发展的源泉和基础。老师,请把教室布置成工作间,为孩子提供多种多样的操作材料和工具,让孩子在摆摆弄弄、拆拆装装、敲敲打打中学会观察、思
“没有民主,就没有社会主义,就没有社会主义的现代化。”建设社会主义民主政治同发展社会主义商品经济一样,是一个逐步积累的渐进过程。本文试图通过对社会主义初级阶段民主
一、侗族地区民间音乐教育侗族民间音乐丰富多彩,品种门类比较齐全,有民歌、歌舞、戏剧、曲艺、器乐等等。就民歌来说,既有单声部歌曲,也有多声部歌曲(侗族大歌);既有室内演