论文部分内容阅读
社交网站的快速发展使得社交领域的推荐逐步成为推荐领域的重要研究方向之一,目前常见的社交领域的推荐有潜在好友推荐和信息流推荐。其中,信息流推荐的主体--信息流即为社交网络中信息流动的总线系统。将网站中的内容按照时间顺序呈现给用户一直是信息流的标准做法,且用户接受快。随着移动互联网和智能终端的广泛普及,使得创造内容的门槛空前降低,以至于时间顺序排列的信息流开始出现明显的信息过载,据Facebook数据显示,有80%的新鲜事不能被用户读到,Instagram也表示有70%的内容被用户错过。所以对各种信息流系统来说,最为重要的是要设法构建一个适用的推荐模型来发现用户感兴趣的信息、提高用户的使用黏性。本文首先介绍社交网络信息流推荐的研究背景和发展历史,然后介绍主题模型与矩阵分解模型的基础概念和基本方法,最终构建基于主题模型和矩阵分解算法的信息流推荐模型。所提模型的主要思想为:根据用户自身的历史微博内容应用LDA模型,提取用户主题维度的特征;然后以用户对词语的偏好替代用户的评分,利用得到的文档-主题分布和主题-词语分布构建用户和词语的隐因子向量,通过矩阵分解算法进行预测推荐,最终生成推荐列表给用户推荐满足其喜好的微博信息。最后,本文在实际的社交数据源上对文中的推荐模型进行了具体实验,并细致研究了实验的结果。首先论述了基于主题模型和矩阵分解算法的信息流推荐实验采用新浪微博的微博内容作为数据源的原因,并用描述性统计方法说明原始数据集的基本结构和内容;其次,本文依照实验流程处理、分割原始数据集作为模型的输入数据。然后通过推荐模型得到每位用户的推荐列表,并就模型结果分析了模型的评测指标。实验表明,在微博文本内容的基础上提取主题的方式可以使推荐模型有较好的推荐效果。