基于集成学习的个性化推荐算法研究

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:maenzehai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网以及电子商务的飞速发展,用户陷入了一种信息迷失的状态,面对海量的商品用户往往在找到感兴趣的商品之前已经非常沮丧、烦躁,因此很可能会放弃此次购物。解决该问题的有效途径一般认为是个性化推荐,协同过滤技术在推荐系统发展初期效果非常不错,但随着用户数目和商品种类的不断增加,打分矩阵变得越来越稀疏,传统的相似度计算方法会产生不准确的相似邻居,从而导致推荐质量下降。另一方面影响推荐质量的因素是很多的,而当前的个性化推荐算法不是单一算法,就是几个算法的简单组合,这些算法普遍准确性不高。集成学习通过集成多个弱学习器解决同一个问题,具有很好的泛化能力和稳定性,目前集成学习已经广泛应用到了很多领域,在最近几年的Netflix、Learningto Rank比赛中,顶级团队大多数使用的也是集成学习技术。因此若能将集成学习技术与个性化推荐相结合,必定能提高推荐系统的准确率。在电子商务快速发展的时代,提高个性化推荐系统的准确率是人们永远的追求目标,针对这一目标,本文的主要研究工作是:1、对协同过滤中的传统相似度算法进行了分析,根据它们存在的缺点,提出了一种改进的协同过滤方法PCS算法。该算法使用决策树自适应调整分割属性的特点,将决策树用于用户的分组上,因此就产生了一种寻找相似邻居的新方法。用户分组后只在组内进行个性化推荐,避免了计算所有用户间的相似度,提高了算法的在线可扩展性。另一方面,针对Pearson相似度存在的缺点,从流行度、用户共同打分商品数和用户打分差异度三方面对Pearson进行了改进,提高了推荐算法的准确性。2、针对目前大多数的算法都是从某一方面考虑提高推荐的准确率,而影响推荐质量的因素是很多的,集成学习算法SoftBoost集成多个弱学习器解决同一个问题,且该算法是最大化软间隔算法,能够避免难分数据的影响,有很强的泛化能力,因此本文将其和个性化推荐相结合,使用SoftBoost算法作为框架的同时,本文使用RankBoost中基于对的思想重新定义了间隔和边界,提出了SoftRankBoost算法。
其他文献
本文首先分析了色彩学基本理论和色彩还原的基本方法,主要介绍支持向量机方法、BP神经网络和RBF神经网络方法。 利用标准色板,分别对支持向量机方法、BP神经网络和RBF神
不同的形式化方法不仅在学术研究中得到支持与倡导,而且目前已经广泛应用到实际工业项目的各个方面。由于计算机系统越来越复杂,可能在一个系统中需要用到多种形式化方法,因
随着分布式系统的广泛应用和面向对象技术的蓬勃发展,以分布式对象为基础的软件系统的应用越来越广泛。分布式对象作为此类系统的基本单元,对此类系统的设计、实现和运行起着
模糊决策是模糊集合论与决策理论相结合的产物,它为解决半结构化和非结构化的决策问题提供了完备的理论依据和方法模型。本文首先对现有的几类典型的模糊决策方法进行了深入
本文首先提出了一种改进的动态时间规整算法并用其来识别八类不同形状的脉象。该方法是基于模板匹配来对模式进行分类的,其优点是分类时无需特征提取,分类器的设计不需
在近20年来图像处理技术和计算机视觉技术变得越来越重要。图像分割又称为图像中物体的边界识别,是计算机视觉和图像处理中最为重要的问题之一。分割技术的应用范围很广,包括
  本文介绍了搜索引擎技术的历史、工作原理、新技术、专业领域数据库搜索引擎和面临的挑战,提出了页面分析与数据提取技术和主动式Web信息获取技术。使用Java以及Oracle9i
由于因特网和嵌入式系统在汽车、飞机以及其它安全系统的成功应用,未来将会更加依赖于计算机设备的功能。由于技术的快速发展,发展验证系统正确性的可靠方法变的越来越重要。目
本文绪论部分详细讲解了本论文课题的来源等背景知识、国内外的研究现状和论文的组织结构。第二章主要是讲述了编程基础知识技能。论述了与本系统设计相关的基础理论知识。如
本文首先讨论双序列比对和多序列比对的定义,介绍多序列比对的四种常用模型,分析其优缺点;然后分析和比较多序列比对的各类算法(精确算法、近似算法、启发式算法和并行算法等)