论文部分内容阅读
随着Web2.0时代的兴起,互联网上的用户和商品呈现了爆炸式的增长态势,互联网的快速渗透带来了海量的数据信息,而海量数据的产生使得用户无法在短时间内准确及时地获取所需的信息,信息过载现象愈发严重。在此背景下,推荐系统应运而生。推荐系统通过研究用户的兴趣偏好,进行个性化的计算,由系统发现用户的兴趣点,进而有选择地进行信息推送,引导用户的信息需求。由于推荐系统能够有效地解决信息过载问题,因而其得到了广泛的研究和应用。然而,近几年来,互联网的快速发展也给推荐系统带来了一些新的挑战。以此为背景,本文首先介绍了信息过载现象,以此引出推荐系统的产生和发展过程,接着介绍了目前主流的推荐算法,此后,本文以协同过滤推荐系统中的时序行为信息挖掘和用户隐私保护为研究点,提出了相应的解决方案,本文的主要研究工作如下:(1)提出了一种利用用户的时序行为挖掘用户和商品近邻关系的方法。该方法通过构建用户和商品的消费网络图,计算最近邻集合,得出相应的关系信息。由于时序信息相对于社交关系、标签信息更加容易获取,因而其适用范围更广泛。(2)将挖掘的关系信息应用到矩阵分解模型中,提出了基于时序行为的协同过滤推荐模型SequentialMF。该推荐模型将利用时序信息挖掘的最近邻集合融入到概率矩阵分解算法中,从而提高推荐算法的准确度。在此基础上,进一步提出了基于该模型的推荐框架,该框架能够在线下更新模型,从而快速在线上完成推荐,使得推荐系统的实时性得到提高。(3)提出了一种能够实现隐私保护的推荐机制GroupMF。该机制收集用户对群组的宏观评价信息,基于此粗粒度的数据,预测用户对具体商品的偏好,进而为用户推荐个性化的商品。由于并不需要用户对具体商品的评价,因而其在一定程度上降低了隐私泄露的风险。(4)通过实验验证了模型的有效性。实验表明,基于时序行为的推荐算法在准确度上比传统推荐算法有了进一步的提升;基于隐私保护的推荐算法虽然在一定程度上造成了准确度的损失,但是其仍然具有一定的推荐效果。除此之外,该方法所需要的数据更容易收集,数据噪音也较少。