自适应用户的Item-based协同过滤算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:qqllql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展所产生的海量信息易造成信息过载问题,导致人们无法从这些海量信息中快速找到所需的信息。解决信息过载问题以帮助人们快速获得所需信息已引起研究者的广泛关注,各种推荐系统应运而生。推荐系统是一种为用户提供个性化信息服务的系统,其核心是推荐算法,而协同过滤算法作为目前应用最成功的推荐算法之一,成为推荐系统领域的一个重要研究方向。虽然在协同过滤算法的基础上衍生出了许多改进算法,但仍存在推荐质量不高的问题。本文在协同过滤算法及其改进算法的基础上,对Item-based协同过滤算法的项目相似性度量方法及评分预测方法进行修正,以更准确地预测用户对未知项目的评分,从而提高推荐质量。论文的主要工作包括:①对推荐系统的发展历程、组成结构、评价指标以及相关技术进行了介绍,重点对协同过滤推荐技术的原理、分类及存在的问题进行了分析与总结。②传统Item-based协同过滤算法在预测目标用户对未知项目的评分时,忽略了目标用户的评分习惯对推荐效果的影响,导致评分预测准确性差。本文将目标用户的评分习惯引入到评分预测阶段,提出了一种改进的评分预测方法。③提出了自适应用户的Item-based协同过滤算法。由于传统Item-based协同过滤算法计算项目间相似性时,将每个共同评分用户(对两个项目都评过分的用户)对项目的评分视为同等重要,忽略了共同评分用户与目标用户的相似性对项目间相似性的影响,导致与目标项目相似性很高的项目在目标用户看来并不相似。本文所提算法将共同评分用户与目标用户的相似性作为共同评分用户的评分重要性权重,以自适应地度量项目间相似性。④在MovieLens站点提供的数据集上,利用Matlab编写算法进行仿真实验,通过与传统Item-based协同过滤算法和其它类似改进算法相比较,验证本文算法的有效性。实验结果表明,相比传统Item-based协同过滤算法和其它类似改进算法,本文算法在评分预测方面有更高的准确率,从而提高了推荐质量。
其他文献
高光谱图像(HSI)的信息量巨大,导致数据的传输、存储及处理都有很大的困难,如何有效地减少数据量、降低数据维数是高光谱图像处理技术中的重要研究内容。本文采用波段选择的方
随着互联网所承载的信息量日益增大,如何在互联网上快速高效的找到用户所需要的数据是互联网发展的方向。结构化数据的存储为海量信息的查找提供了途径,因而出现了越来越多的
随着虚拟化技术大量应用于云计算与大数据领域,数据中心中的虚拟机数量急剧增加。虚拟机热迁移是减少服务器管理和维护花费、提高资源利用率、实现绿色计算的关键技术。本文围
随着Web2.0技术的迅猛发展,互联网已经不仅仅是一个信息获取途径,更重要的,它已成为人们发布信息的平台。微博服务,作为一个新兴的互联网应用,受到用户的追捧。由于用户的广泛参与
随着网上购物的日益盛行,推荐系统成为提高电子商务企业产品销售量的商业工具,也是许多用户越来越重要的辅助决策工具。互联网为用户开放了大量的产品和广告,从众多的产品中做出
随着计算机软件与硬件的飞速发展,图像处理技术在社会的诸多领域得到广泛的应用。对光栅点阵图像进行分析、识别并重建其中图形对象的图像矢量化技术也在诸如工程图纸、地图等
人脸识别在电子商务、视频监控、门禁系统等方面具有广阔的应用前景。近几十年来,已经出现了很多经典的人脸识别方法。大部分经典算法都能够在多样本条件下取得不错的识别效果
随着Web服务研究的不断深入和大量稳定易用的Web服务的广泛应用,如何从众多的服务中高效地发现满足需求的Web服务是一个需要解决的问题。传统的基于UDDI和WSDL标准的Web服务发
互联网和信息技术的飞速发展使我们进入了“信息经济”时代。互联网的用户的规模不断增大,互联网服务对于网络带宽与传输速度的需求不断增加。此外,互联网应用以及用户的多样性
组合编码的计算量非常巨大,编码过程非常耗时,本文在理论研究的基础上,进一步探讨了组合编码并行技术,以期缩短计算时间。在理论研究方面,本文从通用组合编码的性质出发,对通用组合