基于聚类和协同过滤的个性化推荐算法研究

被引量 : 0次 | 上传用户:gsdfs334
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术飞速发展,电子商务网络服务愈趋流行,以及在线用户和信息资源不断增加,用户在信息检索与过滤过程中面对诸多信息选择时,经常会淹没迷失在信息海洋中,很难迅速准确定位查找到所需资源,信息过载越来越严重,用户迫切期望网络信息系统具有某种主动性的推荐帮手功能,能够提供个性化服务协助他们做出决策,于是个性化推荐系统适时被提出,成为解决这些问题的主要手段。个性化推荐算法是推荐系统的核心,关键决定着推荐系统性能。其中,协同过滤推荐方法是目前最流行的个性化推荐技术,是电子商务网站不同程度采用的最广泛最成功的推荐手段,根据与目标用户兴趣爱好相似的其他用户对项目的评价,生成目标用户对未评分项目的预测推荐,尽管自动化、持久性和个性化程度有了明显提高,但传统协同过滤推荐技术在实际应用中存在很多缺陷,现有算法依赖于用户项目评分矩阵,无法摆脱评分矩阵的稀疏性、新用户和新项目的冷开始问题,邻居相似性计算不准确,只考虑用户共同评分项目,忽略用户特征、项目属性等客观内容;在整个用户项目评分矩阵空间在线查找最近邻居,可扩展性和实时性差;同等对待用户不同时期的兴趣偏好,缺乏时效性;预测精度低和推荐质量失真。针对这些问题,本文提出一种基于属性特征和时间权限的非线性组合协同过滤推荐算法。首先,构建用户特征、项目属性矩阵,改进基于用户特征、项目属性相关性的邻居相似性计算方法,避免不相关邻居对邻居相似性统计的干扰,以便获得更加准确的最近邻居集;然后,初始项目预测评分填充用户项目评分矩阵,以增强其稠密性,新用户、新项目分别采用用户特征、项目属性相关性计算其最近邻居集;第三,最终用户预测评分增加时间权限,突出用户不同时期的兴趣差异,使用户最新兴趣权重最大。在上述改进的基础上,为了避免在整个用户项目评分矩阵空间上计算邻居相似性,缩小最近邻居查找空间维度,增强算法的可扩展性和加快在线实时响应速率,本文设计出一种融合聚类和协同过滤的个性化推荐算法。首先,借助Kruskal最小生成树算法优化K均值聚类划分方法,提出基于Anti-Kruskal的K-Means聚类算法,离线预处理数据构造最小代价森林,自动生成K个聚簇与初始聚类中心,以克服K-Means算法的K值和初始聚类中心需要人为随机确定的缺陷,而且不同的K值和初始聚类中心导致划分的聚类不一致,最终也导致最近邻居不准确;其次,考虑用户特征、项目属性矩阵,结合基于Anti-Kruskal的K-Means算法,改进基于项目属性、用户特征相似性的邻居聚类方法;再者,初始项目聚簇预测评分填充用户项目评分矩阵,新用户、新项目的特征属性相似性替代评分相似性;最后,最终用户聚簇预测评分引入时间函数,赋予用户对项目的实际评分不同的权限,缩放原始评分以体现最晚兴趣的时效性。通过C++编程实现以上两个算法,采用MovieLens数据集进行预测准确率实验分析。三种相似性分布及其平均绝对误差实验说明相关相似性分布最合理,其MAE也低于余弦相似性;最近邻居查找效率实验显示第2个改进算法在更小空间内搜寻到更多的最近邻居;两种改进算法与传统算法的平均绝对误差、查准率、查全率比较实验表明,本文所设计的算法通过降低用户项目评分矩阵的稀疏性、冷开始问题,增强可扩展性、实时性和时效性,显著提高了预测精度和推荐性能。最后,分析它们的在线计算速率,与传统协同过滤推荐算法相比,第1个改进算法的时间复杂度基本不变,而第2个改进算法明显优于传统算法。
其他文献
目前,市场上的抹灰机还只能对大部分墙面进行抹灰作业,而靠近屋顶的墙角位置(阴角)只能靠人工完成工作.针对这一现状,采用计算机辅助设计和仿真,同时运用Matlab软件得到抹灰
农网改造是实现农村电网可持续发展的必然选择,我国自1998年起,通过实施农村电网改造、农村电力管理体制改革、城乡用电同网同价以来,我国农村电网网架结构明显增强,供电可靠
背景:严重创伤后应激性高血糖将导致创伤患者死亡率增加和预后不良。研究表明,严重创伤后患者可产生促炎细胞因子TNF-α、IL-6,加重内皮系统与肝组织损伤,最终导致机体凝血功能紊
近年来,国内外许多学者对企业政治关联进行了研究,研究发现政治关联作为一种非正式制度,会对企业业绩产生一定影响。中国处于计划经济向市场经济转型的时期,虽然市场经济成为
本文首先介绍主述位理论和主位推进模式的相关理论。通过对译林版牛津小学英语教材中具体语篇的解构和两个阅读教学的实例设计,讨论主位推进模式在小学英语阅读教学中的运用
高校思想政治教育实效性,是一个常论常新的问题。近年来,虽然我国思想政治教育工作取得了亮眼的成绩,但是也存在不容忽视的问题,即思想政治教育工作实效性存在欠缺。社会呼动
就业质量是空间上处于一定社会范畴内的个人或者组织对自我或者他者的"就业事件"在一定的时间序列中所做的价值的总判断.就业质量的指标向度主要是"五个满意",即个人满意、家
为深入推进贵州省“大生态”战略并为其土地生态安全规划管理提供依据,对贵州省2005—2015年土地生态安全进行评价,并对其2016—2020年土地生态安全状况进行预测。基于DPSIR
伴随美苏冷战格局的形成,贸易出口管制成为美国为首的西方在经济上遏制苏联集团的重要工具。新中国选择倒向社会主义阵营,并在随后爆发的朝鲜战争中与西方兵戎相见,不仅使美
重污染型工业区是国家或地区在工业化成长过程中所形成的传统工业聚集发展的工业经济集中区域,受传统的生产技术条件限制,其生产模式对生态环境造成严重污染,受破坏的生态环