论文部分内容阅读
在当前的信息时代,信息过载问题愈来愈严重,使得用户难以迅速有效地获取所需信息。通过为用户提供个性化的推荐服务,推荐系统可有效解决信息过载问题。协同过滤是目前推荐系统应用最成功和最广.泛的推荐技术之一,但是它依赖用户的历史评分数据,数据稀疏性问题是它的一个主要瓶颈,借助与目标数据跨域关联的辅助数据进行迁移学习以及跨领域推荐是解决此问题的一种有效途径。针对传统的跨领域推荐模型存在的一些不足,本文提出三种新的基于迁移学习的跨领域推荐模型,以及一种新的社交网络影响力最大化算法,并将该影响力最大化算法和文中提出的跨领域推荐模型相结合,构建两阶段的跨领域推荐模型。本文的主要贡献如下:(1)针对目标领域和辅助领域中的评分数据异构的问题,提出一种基于异构用户反馈迁移学习的跨领域协同推荐模型。首先通过对目标评分矩阵和辅助评分矩阵进行归一化预处理以及集合分解,将辅助领域中的异构反馈信息迁移到目标领域,得到用户和项目的初始潜在因子,在此过程中,同时考虑了共享评分模式和领域特有的评分模式,从而有效减少了负迁移;然后基于初始潜在因子,使用皮尔逊相关系数计算相似度并构造相似度图;最后通过图正则化加权非负矩阵三元分解进行迁移学习并预测目标领域数据中的缺失评分。实验表明该模型可改善异构反馈的迁移学习,有效提高了评分预测准确度,且在数据越稀疏的情况下效果越显著。(2)针对传统模型负迁移偏多或正迁移不足等问题,提出一种基于三元桥迁移学习的跨领域推荐模型。首先基于相似度约束,通过评分矩阵的集合分解提取用户的潜在因子和共享评分模式,以及项目的潜在因子和共享被评分模式,同时考虑领域特有模式;然后利用潜在因子中的聚类信息构造邻接图;最后通过用户端和项目端的基于共享模式、潜在因子和邻接图的三元桥迁移学习联合预测缺失评分。该模型在有效减少负迁移的情形下,显著增加了正迁移,实验表明其评分预测准确度优于一些最先进的模型。(3)针对传统模型基于非自适应的用户聚类进行迁移学习以及排名准确度不高的问题,提出一种基于自适应跨领域用户相似度学习的排名推荐模型。首先通过自适应的用户聚类,同时计算目标领域和辅助领域之间基于用户以及基于用户聚类的相似度;然后使用跨领域的用户相似度加权用户潜在因子,进行跨领域相似度约束,迁移跨领域用户之间的特征信息;最后建立一个联合评分预测和列表预测的跨领域排名推荐模型。实验表明该模型的排名预测准确度优于一些最先进的模型,可有效解决排名推荐中目标评分数据的稀疏性问题。(4)针对传统的社交网络影响力最大化算法影响传播范围不广或时间复杂度较高等问题,提出一种基于3-layer局部中心度的社交网络影响力最大化算法,并构建融合影响力最大化的跨领域推荐模型,以系统地解决目标领域评分数据比较稀疏时的项目推广问题。提出一种新的基于3-layer局部中心度的社交网络影响力最大化算法:首先定义3-layer局部中心度以计算节点的潜在影响力值;然后基于线性阈值模型,通过启发式方法选择一部分种子节点,每一次都选取潜在影响力最大的节点作为种子节点进行激活;随后通过贪心式方法选择剩下的一部分种子节点,每一次都选取具有最大影响增量的节点作为种子节点进行激活。实验结果表明,与一些先进的算法相比,该算法在保持较低时间复杂度的同时,具有更广的激活范围。该算法可和本文在前面提出的三种跨领域推荐模型相结合,构成两阶段的融合影响力最大化的跨领域推荐模型。可先利用提出的影响力最大化算法寻找最有影响力的一组用户,然后利用之前提出的跨领域推荐模型为他们推荐最喜欢的项目,从而在目标领域评分数据比较稀疏时实现项目推广效益的极大化。