论文部分内容阅读
随着互联网技术的发展,信息正呈现爆炸式增长。为了解决信息过载,推荐系统应运而生。推荐系统是通过分析用户的兴趣特点和历史行为,主动地向用户推荐他可能感兴趣的信息。决定推荐系统效果的关键是如何正确建模用户的兴趣偏好。目前最为广泛使用的方法是基于协同过滤的推荐技术,它基于“相似的用户对相似的对象有相似的表现”这一假设,通过挖掘用户和对象之间的历史行为信息建模出用户的兴趣偏好,从而实现推荐。然而,传统的方法面临着数据稀疏的问题,即当用户和对象之间的历史交互信息非常稀疏时,传统的协同过滤技术很难从中有效地挖掘出用户的兴趣偏好。 另一方面,随着各种互联网应用的流行,我们能处理的数据也越来越多样化。例如,用户和商品的内容信息,用户之间好友关系,用户在网络中的多种行为,如购买行为、阅读行为、加入群组行为等。这些信息在形式上是多样的,属性上是异质的。如果能针对特定的推荐场景,高效并充分的挖掘和利用这些异质信息,将有效解决传统方法中数据稀疏的问题,从而提高推荐效果。 因此,本文的工作主要围绕基于异质信息的个性化推荐系统展开,针对不同的推荐场景,提出相应的有效融合异质信息的解决方案。本文研究的主要内容和贡献如下: 1.本文针对推荐问题中常见的隐式反馈数据(点击数据、购买数据、收藏数据等),提出了一种基于内容主题特征的加权单类协同过滤算法。该方法通过融合网络中丰富的内容信息来解决隐式反馈推荐时存在的单类问题。具体而言,该方法为每个用户和对象提取出内容主题特征,用以帮助从缺失数据中区分出潜在的负样本。并且在传统矩阵分解模型的基础上融入了基于内容相似性的加权机制,通过内容信息提供的先验来辅助挖掘用户的隐式反馈数据。真实数据集上的实验表明,我们的方法能将网络中丰富的内容信息融入到隐式反馈推荐场景中,帮助解决该场景下负样本缺失带来的困难。 2.本文针对融入社交关系的推荐场景,提出了一种基于社交影响分析的推荐方法,它通过挖掘用户的亲密好友(对用户行为有强影响力的好友)和易感性强度(用户接受好友影响的意愿程度),将网络中用户之间的社交关系有效地融入到推荐当中。为了挖掘每个用户的亲密好友和易感性强度,该方法构造了一个统一的因子图模型(factor graph model)来捕获影响社交关系分析的多个要素,同时提出了社交影响力传播(SocialInfluence Propagation,SIP)算法:通过在社交关系网络中传递两种跟影响力强度相关的信息来学习该模型。最后,在亲密好友和易感性强度的指导下,该方法同时考虑了长期和短期的社交关系影响来提高推荐的准确性。实验表明,我们的方法能将用户之间的社交关系更有效地融入到推荐中,帮助解决数据稀疏的问题。 3.本文针对融入用户多种行为的推荐场景,提出两种基于用户多种行为分析的推荐方法,通过同时建模用户在不同行为之间的相关性和异质性,实现行为之间信息的有效迁移,从而有效融合用户的多种行为信息进行推荐。它们是基于类别分组的潜在因子模型和基于组稀疏的矩阵分解模型。前者将用户各种行为下的评分矩阵分解到共享和独立的两个子空间,建模用户在不同行为下共享的和异质的兴趣爱好,有效地融合用户的多种行为信息进行推荐,它要求不同行为之间共享的因子相同。后者通过组稀疏的约束,自动地学习出不同种类行为下影响用户决定的潜在因素,从而自动地建模不同行为之间的共享信息和异质信息,它允许每两种不同行为之间共享的因子不同。真实数据上的实验表明了我们的方法在融合用户多种行为进行推荐时的有效性。