基于协同过滤的推荐技术研究

来源 :兰州理工大学 | 被引量 : 16次 | 上传用户:gwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为被当前推荐系统最普遍采用并取得较大成功的推荐技术,协同过滤推荐技术根据目标用户(或项目)的访问数据或评价信息找到与其相似度较高的用户(或项目)作为最近邻居,然后根据这些最近邻居的评分来预测目标用户(或项目)的评分并为用户推荐项目。然而在实际应用中,协同过滤推荐面临着评分数据稀疏,冷启动和算法扩展性差等诸多问题。本文重点研究了协同过滤推荐算法,对于该算法存在的问题从不同的角度提出两种改进算法,一方面利用用户背景信息并结合了模糊聚类技术对用户聚类,改进项目相似度计算方法;另一方面充分利用用户评分信息,并突出了用户共同评分的特殊作用。论文具体研究内容主要包括以下三个方面:(1)由于在高维稀疏评分矩阵中,项目相似度的计算不仅不准确而且时间复杂度较高,因此,本文利用用户背景信息对用户进行模糊聚类,从群体的角度考虑项目在各用户群体上的相似性,并为对两个项目有较多用户评分的群体赋予较高的项目相似性权重,提出一种基于加权项目相似性的模糊聚类推荐算法,利用该算法可以在数据极其稀疏并且用户维数较高条件下,提高搜索项目最近邻准确性,并提高协同过滤算法的推荐质量。(2)用户评分信息反映了用户喜好,但由于评分矩阵极端稀疏,如何充分利用用户评分对于发现用户兴趣并做出推荐就显得尤为重要。本文将用户评分划分为两种类型,而在评分矩阵中,用户共同评分数在一定程度上反映了用户间的相似性,因此本文将用户共同评分影响因子引入到相似性计算中,根据共同评分影响因子大小动态选择相似度计算方法,提出一种融入共同评分影响因子的协同过滤推荐算法,该算法充分利用了评分数据,并采用基于奇异值分解的评分填充方法改善数据稀疏性,提高了推荐质量。(3)针对本文提出的算法,在所选数据集上分别与一些传统的协同过滤算法进行了对比实验。实验结果表明,本文提出的算法,在用户评分矩阵高度稀疏的情况下能够有效提高推荐质量。
其他文献
当今社会,计算机网络发展迅速,确保网络信息的安全性就显得尤为重要。能够主动保护信息安全的入侵检测技术,作为一种保障措施而备受关注。神经网络的优势在于,它能够作为一种方法
社交网络的快速发展使得丰富的社交信息被应用到智能推荐领域,个性化推荐面临着巨大变革。近年来,如何利用社交信息解决推荐过程中的用户冷启动问题并提高推荐结果的准确度成为
随着互联网技术的高速发展和众多数据密集型应用的普及,互联网数据规模呈爆炸式增长。为了应对大规模海量数据的存储和处理问题,云计算技术应运而生且发展迅速,Hadoop作为主流的
在互联网高速发展的今天,网络上数据的增长已经非常迅速。如何从海量的数据中找出用户所需要的信息已经变得越来越重要。社交网络在web2.0时代也迅速流行开来,社交网络中文本
近年来,中国铁路在客运提速方面取得了重大成就,铁路客流量每年在逐步增加,进行团体票预订的单位/个人也越来越多,另外随着互联网信息化技术的发展,使得原有的团体票办理监督
随着科技进步和安全方面的迫切需求,单样本人脸识别越来越得到学者们的高度重视,并成为人脸识别领域的一个非常重要的研究分支。针对单样本人脸识别问题,主流的方法可分为四
人类已经进入大数据时代,各类知识和信息纷繁复杂。如何存储和利用这些资源已成为研究的焦点。与此同时各个系统越来越复杂,矛盾问题也越来越多。而计算机和网络也发展迅猛,
文本分割是信息检索和多文档摘要技术中的一个重要的处理步骤。通常一篇文本是由多个主题构成的,文本分割的主要任务是通过对文档结构的分析,识别出文本中不同主题之间的边界
伴随经济全球化和贸易一体化的发展,我国与国外贸易交流日益频繁,各大银行陆续开展了外汇业务,对人民币、美元以及港币等纸币进行严格、有序、高效的流通管理非常必要。因此
无线传感器网络集传感器技术、嵌入式技术、无线通信网络技术于一体,在军用和民用领域中发挥着巨大的作用,受到越来越多的重视和研究。传感器网络中的节点一般采用电池供电,能量