基于概率矩阵分解的多指标推荐算法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:yebailin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤算法是推荐系统中应用和研究较多的经典方法,传统协同过滤算法的主要思想是基于用户对项目的单一综合评分挖掘用户的兴趣并为其做出推荐。然而已有研究表明基于单一评分的方法并不能很好刻画用户的根本兴趣,于是基于多指标评分的推荐技术被提出和使用。这种方法的核心思想是利用用户对项目不同维度的指标评分,对用户建立兴趣模型,为用户推荐提供更加精准的项目列表。当前关于多指标推荐算法研究较少,大都受到数据规模和数据稀疏性的影响,已有相关研究可以分为三类:1)将多指标评分推荐问题分解成单一指标评分问题,然后对每一维指标采用已有的任意协同推荐算法进行预测,然后再将预测结果进行综合作为最终的综合评分预测,该方法缺点是预先假设用户对每维指标偏好程度一样,现实情况是用户对不同指标偏好程度可能是不一致的。2)利用聚合函数将综合评分表示成多指标评分的线性关系,然后利用统计或机器学习的方法得到聚合函数,然后进行预测和推荐,该方法缺点是容易受到训练数据的稀疏性或噪音影响。3)简单的聚类方法,利用潜在语义分析的方法对用户进行潜在语义分析,该方法仅仅考虑了多指标对用户的影响,而忽略了多指标对项目也同样具有影响。针对以上多指标推荐算法研究还存在不足的问题,本文提出一种基于概率矩阵分解的多指标推荐算法(Multi-criteria collaborative filtering algorithm based on Probabilistic Matrix Factorization,MCPMF)尝试解决这些问题。本课题将传统推荐算法矩阵分解中用户-项目关系考虑成三种关系,即用户-多指标关系,项目-多指标关系以及用户-项目关系。借助矩阵分解的思想能降低数据噪音和大规模数据的影响。通过假设三种关系的数据潜在分布都服从高斯分布,然后将多指标对用户和对项目的影响考虑成一个权重矩阵。本课题提出了两种权重矩阵的计算方法,一种是基于多指标评分的协方差矩阵;另一种假设多指标对用户和项目的影响分布服从高斯分布,且两种影响相互独立,将两种影响的联合分布表示成对用户和项目都产生影响的权重矩阵。MCPMF中用户和项目的特征矩阵通过梯度下降法迭代学习得到。在采集到的大众美食点评和携程旅游景点点评两个真实数据集上的实验表明,MCPMF模型与传统针对单一指标模型算法相比,预测精度有一定的提高,与针对多指标的(如:FGPLSA)算法相比也有提高,并且能降低数据稀疏性所带来的影响。本文的主要贡献有:1)对多指标权重矩阵的处理,通过两种权重计算方法来考虑多指标。2)对多指标权重矩阵与用户(项目)特征向量的融合处理,通过假设用户(项目)的潜在分布都会受到多指标的影响,利用概率矩阵分解的思想来处理。3)算法对稀疏数据的适应,利用概率矩阵分解的思想,在一定程度上解决了算法过拟合的问题。
其他文献
在日益激烈的市场竞争中,客户是企业的宝贵资源,他们既是企业现有财富的保障,也是企业未来发展的基础,因而客户的争夺战是企业竞争的焦点。随着市场垄断局面的打破,市场上的厂商获
Internet的发展使得各行业都增强了对IT的依赖,业务处理与IT的集成度越来越高,各行业都在开发关键使命型复杂应用程序,而这些应用程序对用户的可用性和性能日益成为关键问题。在
随着计算资源的飞速发展,深度学习的计算瓶颈逐步得到缓解,计算机视觉方向上的深度学习内容也日益增多。但在立体视觉的相关研究上,基于深度学习的研究并不算完善,而传统方法
网格安全问题是一个热门话题的研究,具有动态性和不确定性的特点。随着动态多结构的虚拟组织之间资源共享和协同合作的需求越来越迫切,网格技术正逐渐走向成熟。然而信任安全问
随着信息技术的急速发展,数据的规模呈爆炸式增长。作为数据分析和知识发现中广泛运用的技术,划分方法在很多领域已经得到了广泛的关注。图作为一种基本的数据结构在复杂网络
SAR(Synthetic Aperture Radar)图像分割一直是SAR图像研究的热点。SAR图像包含丰富的信息,包括边缘特征、区域形状特征、方向特征和纹理特征等。如何合理地提取和利用这些特
发布/订阅系统是一个满足信息的生产者和消费者互动的分布式中间件系统。在易物服务、物品交换等这类服务中,发布者除了发布信息,还需要具备选择订阅者的能力,发布者和订阅者
无线传感器网络是信息感知和采集的一场革命,在新一代网络中具有关键作用。数据融合技术是无线传感器网络中进行数据处理,获得准确查询结果,减少能耗的重要技术之一。由于传
网络抗毁性是深入研究复杂网络必不可少的一方面。在当今社会不同的领域和系统中,复杂网络抗毁性的含义有着一定的差异。在已有的大量文献中,大部分是针对抗毁性测度算法进行
软件种类的层出不穷及其版本的频繁升级,使得网络管理员在维护过程中工作量不断增加,负担也越来越重。如何简单、可靠的实现补丁分发和应用软件统一部署,成为网络管理员关注