基于协同过滤推荐系统的数据稀疏性问题研究

来源 :东北师范大学 | 被引量 : 26次 | 上传用户:wzhjxl3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展和信息资源的不断膨胀,电子商务也随之蓬勃发展,推荐系统被越来越广泛地应用于电子商务的网站中。推荐系统是电子商务个性化服务的重要组成部分,它打破了传统的商业运作模式,扮演着传统商业中销售人员的角色。对于增加商品的销售量,提高顾客的忠诚度等都有较大的贡献。目前协同过滤技术是推荐系统中最为成功的技术之一,并且获得了比较广泛的应用。但是随着用户人数的不断增加和商品本身的因素限制,现有大多数协同过滤算法普遍存在着几点弊端,主要有数据稀疏性问题、系统可扩展性问题、冷启动问题以及同义词问题等。几乎所有的推荐系统中,每个用户涉及的信息量相当有限,而在这些系统中一般用户购买商品的总量却仅占网站所有商品数量的1%甚至更少,因此造成了用户对商品评分的数据非常稀疏。因此,为了提高推荐质量,许多研究人员都试图从不同的角度对用户和商品信息进行分析、处理。本文首先对推荐系统的基本知识进行详细介绍,接着通过阐述协同过滤推荐系统中的问题引出数据稀疏性问题,总结目前解决数据稀疏性问题的几种方案。然后通过对基于项目和基于用户的协同过滤算法的比较与分析,分别从两个不同的方面针对数据稀疏性问题提出改进算法:其一是对提高算法精度的算法引入项目的属性,加入了基于项目类别的用户偏爱度,针对用户更喜爱的项目类别计算与目标项目的相似性,使得计算项目相似性方面减少计算数据,提高计算速度,计算的准确性更高;其二是对降低数据集稀疏性方法采用Slope One方法预测填充未评分的项目,降低数据集的稀疏性,计算目标项目与其他所有项目的相似性,然后对目标项目进行推荐。对改进算法进行了相似的理论分析,阐述其可行性,给出了改进算法在标准数据集上的实验结果,并对改进算法与原算法进行了相关性能的比较分析。实验表明,改进的算法能够有效缓解数据稀疏性问题,提高推荐系统的推荐质量。
其他文献
随着信息化的普及,计算机已走进了千家万户,为人们的生活带来了极大的便利。然而,在使用计算机的过程中,也会由于各种原因导致重要文件被删除或遭到破坏,造成无法挽回的损失
随着网络技术的发展和数据库应用领域的不断扩大,政府、企业、个人根据需要在互联网上发布自己的数据,而一些研究部门则研究他们发布的数据。在这些数据中包含了社会中各种各
网络流量是由不同应用类型的流量成分混合而成的,充分理解总体流量的构成以及各种成分的变化规律对网络管理和网络行为学研究具有重要意义。源宿IP、源宿端口与协议在五个维
随着互联网的发展和全球经济一体化,电子商务的建设变得非常重要。近年来,网络的迅猛发展给人们生活各个方面带来很大的便利,也使得企业向着信息化的方向发展。同时,企业的需求也
Web挖掘是将传统数据挖掘与Web结合起来的技术,其中Web使用挖掘的挖掘对象是用户和网络交互过程中抽取的Web日志数据。对这些数据挖掘可以帮助理解用户的行为,从而改进站点的
随着移动通信迅猛发展,手机已成为集通讯、报纸、广播、电视及电脑优势于一身的移动通信终端设备。MTK平台因其开发门槛低、开发周期短、功能集成度高而成为国内生产手机的主
随着信息化社会的不断发展,计算模式已由传统的桌面计算逐渐转变为普适计算。在这个信息空间与物理空间高度融合的环境中,用户可以随时随地、透明地享受普适环境中提供的各种
随着数据挖掘和数据发布等数据应用的出现与发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战。匿名化技术由于能在保护隐私信息的同时,保证对外发布数据的真
随着计算机技术,特别是网络技术的迅速发展和普及,人们越来越迫切地希望用自然语言与计算机交流。因此自然语言信息处理得到了前所未有的重视,受到了国内外许多研究者的关注
随着移动互联网的日新月异,智能手机也渗入人们工作与生活的方方面面。由于用户对智能手机依赖性的日益增强,越来越多的用户隐私数据存放在手机当中。因为用户的隐私信息关系