论文部分内容阅读
推荐系统的协同过滤算法已经得到了人们普遍的关注并取得了很大的进展,而矩阵分解方法在协同过滤技术中占有举足轻重的地位。为了建立推荐信息,协同过滤技术需要把用户和物品这两种有着本质不同的实体联系起来,联系的关键在于用户的历史行为数据,通常的做法是将这些行为数据表示为用户和物品的关系矩阵。推荐系统的性能依赖于输入的数据,最高效的数据是用户的显式反馈,也就是直接的兴趣表达。传统的矩阵分解方法主要是将原始的矩阵分解成用户和物品两个矩阵,将两个有着本质区别的实体映射到相同的隐语义空间之中,通过描述两个实体在隐语义空间中的特征来解释链接和评分。由于显式信息并不是经常可用的,因此改进模型的一个重要的方向是利用比较丰富的隐式反馈,间接地推断用户的喜好。隐式反馈的类型有多种,近年来已有许多工作研究如何衡量这些信息在推荐中的重要性,并且成功地运用到了模型中。产生更精确的推荐结果需要识别数据中所有可用的特征,使用更多的可用特征可以解决关系矩阵的稀疏性问题,并且提高模型的适用范围。但是隐式反馈并不能直接反应用户的偏好,因而在实际运用中要以显式的反馈信息为主,以隐式反馈信息为辅,综合利用多种类型的数据,捕捉用户和物品之间复杂的交互作用。矩阵分解由于其出色的可扩展性,能够在显式反馈和隐式反馈之间找到平衡,得到了广泛的使用。现实世界中事物的联系可以用网络的结构来表示,当代表实体的节点的规模大到一定程度时,节点之间形成了错综复杂的联系,通常用复杂网络(complex network)来描述这种大规模的网络。复杂网络既不是规则网络,也不是随机网络,而是具有新的统计特征。我们发现高阶连接结构如三元组、四元组的存在对于解析复杂网络中的邻域结构有着重要的影响,特别是面临网络中的链接预测和推荐的任务时,高阶连接结构能够揭示不同实体之间隐含的关系,将高阶连接结构引入推荐模型中能够很好地补充训练集中的数据,缓解原始数据集稀疏性的问题。另外,网络中的节点往往归属于不同的角色,传统的矩阵分解技术通常工作在用户和物品的二元实体网络中,然而,我们发现在这两个实体之外,还存在着与原有的节点产生交互作用的其他实体,如果在模型中引入这些多元实体,就能够更好地描述网络中发生的复杂关系。由于其他实体与用户和物品的之间的连接隐含在原有的网络之外,所以我们利用这些隐含关系作为模型的辅助信息,结合二元实体网络中的显式信息来进行推荐,提出了融合隐含关系的推荐算法。我们的研究充分利用了事物之间普遍存在且多种多样的复杂关系,展示了矩阵分解技术在个性化推荐上的新运用,从隐含的反馈信息中得到了新的推荐特征,不仅缓解了原始关系矩阵的高度稀疏问题,同时也提高了推荐的准确度,拓展了使用隐式反馈的推荐模型的使用场景。本文的主要贡献如下:1.我们发现在角色多重性的复杂网络之中,高阶连接结构揭示了网络演变过程中的隐含关系,对于提升推荐模型的性能有着重要影响。我们利用元组提取的方法在网络上统计出了各种高阶连接结构,根据高阶连接结构在网络中的分布规律,分析各种元组所代表的网络结构演化的趋势,找出对于推荐任务效果最显著的几种高阶结构,将之作为特征构建出耦合的张量数据模型,并联合反馈信息矩阵进行了分解。通过企业供需数据集上进行的对比实验,表明了高阶连接结构对于基于复杂网络的推荐系统的重要作用。2.我们在传统的用户和物品实体向量之外,引入了对推荐结果起正面作用的新的实体向量,从而更好地挖掘真实世界中存在于多个实体之间的隐含关系,提升了模型的适用范围。传统的矩阵分解方法基于用户-物品的关系矩阵运行,而我们的算法运行在多元实体之间的多种复杂关系上,通过构建出描述多个实体相互作用的耦合数据模型,我们不仅在隐语义空间上训练用户和物品的特征向量矩阵,而且也将其他实体投射到相同的隐语义空间之中,从而调整了空间中的用户向量和物品向量的特征因子,更好地拟合了已经观测到的评分记录。通过在公开数据集MovieLens上的对比实验,验证了算法的先进性,表明了融入隐含关系能够很好地提升推荐系统的性能。