论文部分内容阅读
在互联网时代,人们不受时空限制地享受着互联网提供的信息和服务的同时,也不得不面对海量且规模不断增长的数据以及大量的无效信息。推荐系统作为信息过滤的重要工具,同时为用户提供个性化的信息服务,越来越受到人们的欢迎,并且必不可少。典型的推荐技术为协同过滤算法,该算法利用其他购买过共同物品的相似用户来预测当前用户的偏好,由于其重要的应用价值和学术价值,已经被工业界和学术界广泛的研究。然而,在多个用户的历史行为混合且无法显式区分时,或用户行为受到系统中的其他用户影响时,很多算法都不能较好地准确表示用户的真实兴趣或偏好,进而影响到推荐服务的性能。因此,本文尝试用虚拟用户重新表示每个用户的真实偏好,并提高推荐的品质。虚拟用户是表示真实用户兴趣并用于帮助产生推荐的向量或配置文件。针对以上两种情况,本文分别从用户分解和社交融合两个方面研究虚拟用户对推荐性能的影响。本文首先提出两种用户分解算法来研究用户历史行为混合的情况下,如何表示虚拟用户,利用虚拟用户识别真实用户,并为识别的用户做个性化推荐。在网络协议电视服务中,家庭成员无差别地使用该服务,为研究混合的用户行为提供良好的研究对象,这里的两种方法都是在该服务上进行。第一种方法是基于时间片分割的用户识别推荐算法。该方法定义一个时间片内的活动为一个虚拟用户的活动,并利用隐式评分捕获虚拟用的偏好,合并偏好相似的虚拟用户作为真实用户,并为这些用户做个性化的推荐;第二种方法是基于子空间聚类的用户识别推荐算法。该算法基于账户-项目-时间的张量分解和子空间聚类来发现用户的时序行为,利用聚类的时间段来表示虚拟用户,合并偏好相似的虚拟用户作为真是用户,并为这些用户做个性化的推荐。实验表明两种方法都比之前的方法性能更优,并且第二种方法比第一种方法更自动化且性能更好。在社交网络中,用户之间进行各种各样的交流,为研究用户间的兴趣相互影响提供了理想的研究对象。因此,基于用户(或用户对物品的偏好)受到其社交邻居的影响这一假设,本文进一步提出融合社交影响力的两种新颖的推荐算法。这两种方法在用户-物品矩阵分解框架的基础上融合用户-用户社交链接矩阵。具体而言,利用用户评分和该用户社交邻居的评分构建虚拟用户来表示用户的真实偏好。第一种融合个性化因素和加权社交影响力的方法,利用用户和社交邻居之间的隐式偏好构建社交影响力,在预测时同时结合用户个人因素和社交影响力带来的偏好影响,在很大程度上可以提高对评分较少的用户的预测性能。然而,每个用户受到其社交邻居的影响程度不同:不仅个数不同,而且相互的影响程度也不同。因此,第二种方法利用非对称社交影响力来重新表示用户间产生的相互影响。同时,实验结果证明本文提出的方法比目前的其他方法更加准确而高效。