面向稀疏数据优化的协同过滤推荐算法

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ricky1281214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务平台的不断扩大,作为个性化推荐中运用最普遍的技术之一,传统的协同过滤推荐算法面临着一系列严峻的挑战,比如评分矩阵的极度稀疏、冷启动等问题。本论文针对这些问题提出了一些改进方法,论文的主要工作如下:(1)提出了一种基于项目属性特征预处理的协同过滤推荐算法。该算法通过引入项目的属性特征信息,获取项目间属性特征相似度,以此来预测用户对评分缺省项的打分值,并将该值填入到数据矩阵中对应的位置,从而使得评分矩阵近乎饱和。接着再对稀疏数据集中的未评分项目进行混合填充预处理,有效避免了传统均值填充法中的用户对项目的评分完全相同的问题以及众数填充法所面临的“多众数”和“无众数”问题。最后,对经过混合填充预处理后的“用户-项目”评分矩阵进行相似度计算,然后依据相似度计算的结果来搜索并生成最近邻,最终通过这些最近邻居为用户做出推荐。结合实验,验证了改进算法能够有效的改善推荐系统数据稀疏性以及冷启动问题。(2)提出了一种综合项目评分及属性的协同过滤推荐算法。传统的协同过滤算法在获取项目间相似度时往往只依赖于项目的历史得分数据,这种在生成项目间相似度时只考虑评分的做法显得很片面,而且无法有效的缓解推荐系统所面临的冷启动问题,造成新项目或者评分次数太少的项目无法得到推荐,从而对推荐系统挖掘长尾项目的能力造成影响。因此,在获取及生成项目间相似度时,还需要把项目属性特征这些较为容易获取和稳定的因素包含在内。针对这个问题,本章在传统协同过滤算法的基础之上进行了一些改善,在生成项目间相似度时,综合项目评分和项目的属性特征,从而提高推荐系统发掘长尾项目、缓解系统冷启动的能力。(3)在MovieLens数据集上对改进算法进行了实验,相关实验结果表明本论文提出的改进算法可以有效的缓解传统的协同过滤推荐算法面临的数据稀疏性和冷启动问题,提高系统的推荐精度和推荐覆盖率。
其他文献
本文认为我国民事诉讼法把督促程序与通常程序截然分开的规定是立法上的一个重大失误,不符合现代民事诉讼的基本法理,应修改为一旦债务人提出异议就转入通常诉讼程序,即督促
静脉穿刺是临床一项常用的护理操作,对抢救患儿生命,促进康复起到积极作用.如操作不当,技术不熟练等均会发生一些意外情况,并可直接影响抢救的成功率.小儿皮肤娇嫩,静脉细小,
精馏过程是一个多输入和多输出过程,内在机理复杂,具有大惯性、大迟延和时变等特性,其控制直接影响到工厂的产品质量、产量和能耗。本文中将专家控制原理与常规PID控制相结合
泛发性脓疱型银屑病(generalized pustular psoriasis,GPP)皮损广泛,多伴有全身症状,甚至会危及生命。GPP的发病机制仍不清楚,其治疗同样是非常棘手的问题,选择性生物制剂的
介绍个性化推荐系统的冷启动问题,分析解决冷启动问题的多种方案,如利用用户的注册信息、选择适当物品以启动用户兴趣、利用物品内容信息,发挥专家作用,为解决推荐系统的冷启
平均主义的社会思潮长期存在的社会根源是 :自给自足的自然经济和小生产方式是平均主义长期存在的经济基础 ,传统的计划经济体制是平均主义长期存在的体制根源 ,对社会主义及
邻苯二甲酸酯是一类广泛使用的增塑剂,随着塑料制品特别是聚氯乙烯(PVC)的大量生产和使用,邻苯二甲酸酯不断进入环境,已经成为全球性的污染物。许多邻苯二甲酸酯类化合物具有
硬膜外麻醉下行腰椎间盘突出症的髓核摘除手术中,在推挡神经根时,经常会有因脊神经根阻滞不全,病人因此而感到剧烈疼痛的情况.本研究在硬膜外麻醉基础上经术野联合蛛网膜下腔
况钟是大家所熟悉的著名历史人物。五六十年代,在全国各地上演的昆剧《十五贯》,即是依据况钟的历史原型塑造的清官形象。然而,昆剧《十五贯》中的况钟,只仅仅反映了他为民申
目的:建立测定炎痢净片中芍药苷的含量及溶出度的方法。方法:采用SinoChron ODS-BP色谱柱(250 mm×4.6 mm,5μm),流动相为乙腈-0.1%磷酸(14:86),流速1.0 ml·min-1,检测波长285 n