基于动态集成方法的混合推荐系统研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:a294953312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,尤其是社会网络流行和被人们普遍使用,信息已经出现爆炸式的增长。网络中存在的海量信息,为用户提供了非常多的选择,但是这么多的选择,却让用户更加的无所适从。虽然这些信息存在着巨大的作用和商业价值,如何为用户提供更好的服务,产生更大的价值,成为了研究者当前研究的热点。随着互联网的进步和研究人员的努力,推荐系统技术成为了缓解信息过载问题的一种非常有效的方法。它可以从海量的信息中,挖掘出有用的信息,为用户提供更好的服务,例如得分的预测,项目列表的推荐等。在现实的推荐系统中,协同过滤技术是最流行和被广泛应用的推荐算法。它分为两种类型的方法,集基于记忆的方法和基于模型的算法。在现实的网络中,像电影评分,都可以采用上面的两种类型的方法进行预测。但是真实的电影评分数据,每一个用户拥有的数量和评分的偏好都是不一样的,这就导致协同过滤中,两种类型的方法对于每一个用户的预测准确度是不相同的。这两种类型的方法事实上针对评分的数据的地方是不一样的,其中基于记忆的协同过滤方法更适合发现相似的用户,如果用户的数据比较少,则表现比较不稳定,而基于模型的方法主要种全局优化,而忽略了评分数据比较多的用户的特点。并且随着社会网络的发展,信任关系在服务中起着越来越重要的作用,不可被忽略。因而基于信任的推荐方法被提出,并证明即使用户拥有比较少的信任关系,也可以通过社会网络中的信任关系提供更准确的推荐。但是当一个用户拥有比较少的朋友时,基于信任的推荐方法表现比较差。在社会网络中,对于每一个用户来说,由于信任关系和评分数据分布不均衡,传统的协同过滤推荐算法和基于信任的社会推荐在推荐时在对每一个用户进行预测时,都有不同的表现。例如在一个用户有非常多的评分情况下,即使拥有的信任关系比较少,使用协同过滤算法要比基于信任的推荐方法此时预测的效果要好。与之相反,在用户在拥有大量的信任关系,即使缺少评分数据的情况下,基于信任的推荐方法表现的要比协同过滤的方法好。在本论文中,我们针对上面提出的问题,主要做了下面的探索和研究:1)针对评分数据分布不均衡问题,将基于记忆中的最近邻方法和基于模型中的概率矩阵分解的方法集成,提出了一种混合推荐模型DPMFNeg,它根据用户在评分数据集上的分布特点,结合基于记忆的推荐方法和基于模型的算法的优点。我们在两个公开的数据集MovieLens-100K和MoiveLens-1M上做了大量的实验来查看我们方法的性能,并且根据我们提出的方法和其它流行方法的MAE和RMSE结果,显示了DPMFNeg方法表现的要比其它方法要好。2)尽管传统的协同过滤算法是推荐系统中非常高效的推荐算法,并且上面我们提出的混合协同过滤模型,可以更好的处理评分数据中分布不均衡问题。但是由于其忽略了社会网络中的信任关系,因此我们接着提出了一种用户自适应的混合推荐模型DTMF,它可以集成基于信任的推荐方法和概率矩阵分解的方法的优点,根据用户的特点和数据分布情况,学习到适合每一个用户自己的结合参数。在拥有社会关系的Epinions和Flixster数据集上,我们通过实验探究我们提出的方法的性能。实验结果表明了DTMF要比对比的流行推荐算法,更好的提高推荐的效果。通过我们的研究,提出的动态集成的两种混合推荐模型,有效的缓解了评分数据和社会关系数据的分布不均衡问题,并且能够根据用户的特点,更好的集成两种方法的优点,为用户提供更准确的预测。
其他文献
语义搜索是语义网研究领域的一个重要内容。通过充分利用底层数据丰富的语义信息,语义搜索力图为用户直接提供精准的答案,而不仅是包含有所查关键字的文档。然而,这种语义搜
随着计算机图形学理论和技术的不断发展,人们开始一步一步地模拟我们身边的这个世界。从建筑到家具,从城市到自然,图形学的技术使得我们可以将这个现实的世界完完整整的映射进虚
尽管工作流技术由最初的萌芽逐步发展起来,并取得了相当的成功,’但是,从工作流的实际应用状况来看,还远未达到人们所期待的水平。因为企业中存在大量的临时决定的、非结构化
随着Intemet技术的不断发展,IPv4网络协议技术暴露出的问题日益显著,如地址空间紧张、安全性差、服务质量无法保障和路由表爆炸等,其中地址空间的匮乏严重影响了网络技术的发
建设信息高速公路与规划信息网络以推动政治、经济、文化的发展已成为世界各国政府的共识。电子政务作为政府信息化的重要标志,成为信息高速公路的首要应用领域。近年来我国电
显示设备的色彩校正通过对显示图像的色温校正、Gamma调整以及图像抖动等一系列处理过程实现颜色重现的一致性,满足各类显示质量的要求,在视频图像显示处理中占有举足轻重的作
灾难恢复对于诸如银行等重要组织机构信息系统是一项非常重要的技术,因为这些机构的数据是非常致命的。本论文主要研究的内容是工商银行灾难备份系统的体系结构、虚拟磁带库
制造执行系统(MES)是面向生产车间的管理信息系统,它填补了企业计划管理层和车间控制层之间的“鸿沟”。合理且优化的作业级生产调度对于MES在制造企业成功实施有着关键的决定作用。随着技术的进步,具有悠久历史的生产调度问题研究领域目前正朝着柔性化、动态化、多目标化等方向发展。本文依托离散制造企业制造执行系统为应用背景,研究符合生产调度理论发展方向且适合当前实际生产的柔性制造动态多目标调度技术。对现阶段
传感器技术、微机电系统、现代网络和无线通信等技术的进步,推动了具有现代意义的无线传感器网络的产生和发展。无线传感器网络(wireless sensor network)是由部署在监测区域
目前,Ad hoc网络越来越受到关注。在这个领域内,广播、路由等等问题都是研究的热点。本文就Ad hoc网络中的广播技术进行了深入的探讨。现有的广播协议大多基于概率、区域位置