基于矩阵分解和隐含关系的个性化推荐

来源 :山东大学 | 被引量 : 0次 | 上传用户:heroic008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统的协同过滤算法已经得到了人们普遍的关注并取得了很大的进展,而矩阵分解方法在协同过滤技术中占有举足轻重的地位。为了建立推荐信息,协同过滤技术需要把用户和物品这两种有着本质不同的实体联系起来,联系的关键在于用户的历史行为数据,通常的做法是将这些行为数据表示为用户和物品的关系矩阵。推荐系统的性能依赖于输入的数据,最高效的数据是用户的显式反馈,也就是直接的兴趣表达。传统的矩阵分解方法主要是将原始的矩阵分解成用户和物品两个矩阵,将两个有着本质区别的实体映射到相同的隐语义空间之中,通过描述两个实体在隐语义空间中的特征来解释链接和评分。由于显式信息并不是经常可用的,因此改进模型的一个重要的方向是利用比较丰富的隐式反馈,间接地推断用户的喜好。隐式反馈的类型有多种,近年来已有许多工作研究如何衡量这些信息在推荐中的重要性,并且成功地运用到了模型中。产生更精确的推荐结果需要识别数据中所有可用的特征,使用更多的可用特征可以解决关系矩阵的稀疏性问题,并且提高模型的适用范围。但是隐式反馈并不能直接反应用户的偏好,因而在实际运用中要以显式的反馈信息为主,以隐式反馈信息为辅,综合利用多种类型的数据,捕捉用户和物品之间复杂的交互作用。矩阵分解由于其出色的可扩展性,能够在显式反馈和隐式反馈之间找到平衡,得到了广泛的使用。现实世界中事物的联系可以用网络的结构来表示,当代表实体的节点的规模大到一定程度时,节点之间形成了错综复杂的联系,通常用复杂网络(complex network)来描述这种大规模的网络。复杂网络既不是规则网络,也不是随机网络,而是具有新的统计特征。我们发现高阶连接结构如三元组、四元组的存在对于解析复杂网络中的邻域结构有着重要的影响,特别是面临网络中的链接预测和推荐的任务时,高阶连接结构能够揭示不同实体之间隐含的关系,将高阶连接结构引入推荐模型中能够很好地补充训练集中的数据,缓解原始数据集稀疏性的问题。另外,网络中的节点往往归属于不同的角色,传统的矩阵分解技术通常工作在用户和物品的二元实体网络中,然而,我们发现在这两个实体之外,还存在着与原有的节点产生交互作用的其他实体,如果在模型中引入这些多元实体,就能够更好地描述网络中发生的复杂关系。由于其他实体与用户和物品的之间的连接隐含在原有的网络之外,所以我们利用这些隐含关系作为模型的辅助信息,结合二元实体网络中的显式信息来进行推荐,提出了融合隐含关系的推荐算法。我们的研究充分利用了事物之间普遍存在且多种多样的复杂关系,展示了矩阵分解技术在个性化推荐上的新运用,从隐含的反馈信息中得到了新的推荐特征,不仅缓解了原始关系矩阵的高度稀疏问题,同时也提高了推荐的准确度,拓展了使用隐式反馈的推荐模型的使用场景。本文的主要贡献如下:1.我们发现在角色多重性的复杂网络之中,高阶连接结构揭示了网络演变过程中的隐含关系,对于提升推荐模型的性能有着重要影响。我们利用元组提取的方法在网络上统计出了各种高阶连接结构,根据高阶连接结构在网络中的分布规律,分析各种元组所代表的网络结构演化的趋势,找出对于推荐任务效果最显著的几种高阶结构,将之作为特征构建出耦合的张量数据模型,并联合反馈信息矩阵进行了分解。通过企业供需数据集上进行的对比实验,表明了高阶连接结构对于基于复杂网络的推荐系统的重要作用。2.我们在传统的用户和物品实体向量之外,引入了对推荐结果起正面作用的新的实体向量,从而更好地挖掘真实世界中存在于多个实体之间的隐含关系,提升了模型的适用范围。传统的矩阵分解方法基于用户-物品的关系矩阵运行,而我们的算法运行在多元实体之间的多种复杂关系上,通过构建出描述多个实体相互作用的耦合数据模型,我们不仅在隐语义空间上训练用户和物品的特征向量矩阵,而且也将其他实体投射到相同的隐语义空间之中,从而调整了空间中的用户向量和物品向量的特征因子,更好地拟合了已经观测到的评分记录。通过在公开数据集MovieLens上的对比实验,验证了算法的先进性,表明了融入隐含关系能够很好地提升推荐系统的性能。
其他文献
稳态可塑性是神经元通过调节突触强度来抵消过度兴奋或抑制的负反馈机制,神经元以此来适应网络活动的变化,从而维持正常的功能活动。根据发育阶段,细胞组织类型和实验条件等
长期以来,自由与平等之间的关系都是西方哲学界讨论的焦点之一。无论是以诺齐克为代表的自由至上主义者,还是以科恩、罗默、尼尔森为代表的分析马克思主义学者,他们都围绕该问题展开过深入的研究,并在此基础上形成了两大派系之间的长期争论。本文立足分析马克思主义立场,旨在通过分析诺齐克自由至上主义理论及其困境,以批判为手段重塑分析马克思主义对诺齐克自由至上理论的阐释,并在此基础上界定并阐明分析马克思主义在自由与
随着我国经济社会的发展,电梯已经走入千家万户。伴随着电梯的出现,建筑物的高度得以不断增长,土地资源被充分利用,社会资源得以高度集中,人们的生活水平、劳动条件得到提升
辅导员是高校思想政治教育的骨干力量,是高等教育的一线工作者。在思想政治教育与信息技术融合的时代,辅导员势必要掌握网络新媒体,不断提升教育管理服务工作的质量和水平。微信公众号是顺应移动互联时代阅读方式的“网红新媒体”,是网络思想政治教育的新利器。辅导员微信公众号建设体现了辅导员角色要求和工作方式的因事而化、因时而进、因势而新。辅导员微信公众号的生成和发展区别于高校其他类型公众号,具有自身的特点、功能
癌症等疾病的高发病率,有大部分的原因是与周围环境有关,大气污染影响体内鸟苷转变为8-羟基-2’-脱氧鸟苷(8-OHdG)的过程,并且干扰肾脏调节体液酸碱平衡的能力,环境中金属含量
流体介质作用下的轴向移动带系统在工程设备中有着广泛的应用,移动带表现的柔性结构等特征导致在系统受到外界激励时就很容易产生横向振动,而流体介质作用更是会加剧轴向移动
生活在高山盐湖中的卤虫,为了适应缺氧、干燥、高盐等恶劣条件,进化出了特殊生殖方式。在相对适宜的环境中能够直接产出无节幼体,行卵胎生,而在极端环境下则产出休眠胚胎,行
图像在生成和网络传输过程中会因各种条件限制或外界干扰被噪声污染,进而使图像中的一些信息被掩盖。甚至,图像在受到严重噪声污染时还可能会产生变形,失去其原本的意义。通过采购优良的设备,从硬件角度来改善图像质量会有很大的资金消耗。但在实际操作中又很难大幅降低外界干扰来提升图像质量。故图像去噪技术应用而生。图像去噪技术是利用现有的噪声观测图像,滤除其中的噪声部分以获取原本的真实图像的一种图像预处理技术。图
目的为了研究重组人血管内皮抑素联合奈达铂与多西他赛化疗方案治疗进展期贲门癌的近远期临床疗效及安全性。方法选取2016年7月至2018年9月山东省滨州医学院附属医院收治的70
20世纪70年代,广义系统理论被提出.与正常系统相比较,广义系统可以更准确地描述实际系统,具有更广泛的应用.广义系统的容许性问题是控制领域的研究热点.时滞现象广泛存在于网络控制系统、机械传动系统以及经济系统等各类系统中.时滞的存在影响系统的动态性能,往往导致系统的性能变差.时滞系统稳定性问题的研究得到了国内外控制界学者的关注.对于连续广义时滞系统容许性问题的研究,首先要保证系统的正则性和无脉冲性,