基于群组发现和区间划分的协同过滤推荐系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xunitt1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速普及,各行业都进入互联网时代,用户数和行业项目数的迅速增长带来了信息过载的问题,海量数据让用户经常无法方便地得到自己关注的信息。继搜索引擎之后,个性化推荐技术的出现让用户摆脱输入描述信息的困扰。作为解决信息过载问题的重要方法,个性化推荐技术已经在电子商务、视频、音乐、社交网络等领域扮演着重要的角色。其中,协同过滤算法是推荐算法中使用率最广、最为成功并得到了大量的研究和使用。协同过滤算法流程直观,但在信息爆炸的环境中还是暴露出数据稀疏、可扩展性等问题,这些问题经常会大幅影响推荐效率、推荐精准程度。针对稀疏性和推荐精准度,本文展开如下研究:第一,针对传统协同过滤中数据稀疏性问题,提出了一种基于谱聚类和FCM聚类的群组发现数据预处理方法。该算法将用户项目评分矩阵转化为无向图,结合相似性计算和谱聚类算法得到以特征向量形式存在的群组,并结合最大最小相似度方法优化FMC初始聚类中心找寻,对特征向量聚类计算用户、项目对群组的隶属度,最终得到群组以及用户项目对群组的隶属度矩阵。结合标准数据集设计实验验证,实验表明该算法能有效降低数据稀疏性,与推荐算法结合后能提升推荐精准度。第二,在上一步解决稀疏性问题的基础上,针对传统相似性算法忽略用户评分标准差异的问题,提出了基于用户偏爱区间划分的协同过滤算法。该算法统计并计算用户对评分值的使用概率,并将概率映射并划分用户偏爱区间,将偏爱区间转化为坐标形式并结合相似度计算方法挖掘最近邻居集合,通过最近邻居的评分预测目标用户的评分,并综合各群组给出最后推荐结果。结合标准数据集设计实验验证,实验表明该算法能明显提高推荐精准度。将上述算法应用到宜家项目推荐模块中,详细介绍主要nodejs功能库、推荐架构设计和核心部分实现细节,先利用预处理方法挖掘出群组,在群组中直接使用基于用户偏爱区间划分的协同过滤算法,并综合各群组实现最终推荐,取得了良好的推荐效果。
其他文献
目的探讨急性白血病(acuteleukemia,AL)患者细胞中脑膜瘤1基因(meningioma1,MN1)的表达情况及意义。方法将76例AL分为新近诊断AL组57例,AL复发组10例,AL持续完全缓解(CCR)组9例。新
吸贩交织现象普遍存在,吸毒是进入一个圈子,毒品圈子的单一性和递进性构建了吸毒人员能够实施贩毒行为的人际关系;暴利并不是吸毒者开始贩毒的主要追求,当毒品让吸毒者失去理
为了能进行实时有效的VNC图像传输,提出了将H.264视频压缩技术应用到VNC的编码模块中。为了进一步提高系统的图像传输速度,对H.264进一步优化。将视频帧预测模式按照在实际的
随着人们生活水平的不断提高,汽车已经从一种奢侈品逐渐成为非常普遍的代步工具。然而,世界范围内能源危机及环境污染的加剧对汽车行业的发展提出了节能、减排的要求,因此铝
本文通过对宁夏回族自治区灵武市近五年来校园足球开展情况进行实地调研,分析了西部边远少数民族地区县级市在推动校园足球运动特色方面的开展现状、取得成绩和存在问题,并提
城市配电网规划是一件大事利国利民,规划科学与否将有生命有很大的关系的质量,而在城市配电网,由于各种因素的实际规划有致的城市共同作用配电网规划,影响城市配电网规划的质
钢轨扣件系统主要功能是保持钢轨的空间位置。随着铁路的快速发展,扣件系统在服役过程中存在不同程度的损伤。扣件系统损伤对行车的安全性和稳定性有很大的影响,频繁地更换和
中成药的剂量用法与疗效分析任玉庆施亚珍江苏南通市通济医院226005中成药由传统的汤剂发展而成,是中医药的重要组成部分。但从目前的用药情况来看,有些中成药在临床上仅为一种“可有
目的评价游离钙水平在脓毒症患者中的预测预后的价值,同时分析引起脓毒症患者中游离钙下降的可能因素。方法回顾性研究我院ICU80例脓毒症患者,连续动态监测入ICU后24小时内游
本文用内梅罗污染指数法对福建省10种类型陆源人海排污口的邻近海域水环境质量进行了综合评价,提出了把排污口的特征污染物作为海域水环境评价的主要参评参数,使评价结果更客观