基于图模型引入辅助信息的推荐算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：youqing_2009

【摘要】

：

随着互联网的普及和计算机技术的快速发展,越来越多的数据涌入我们的生活中。海量的数据造成了信息过载的问题,用户容易被没有价值的信息所干扰。推荐系统通过对用户历史行为

【作者】

：

饶志伟

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

推荐算法主题模型矩阵分解辅助信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的普及和计算机技术的快速发展,越来越多的数据涌入我们的生活中。海量的数据造成了信息过载的问题,用户容易被没有价值的信息所干扰。推荐系统通过对用户历史行为的分析,研究用户的兴趣偏好,主动地向用户推荐可能感兴趣的信息,能够有效缓解这种情况。传统的推荐算法依靠用户的历史评分进行推荐,但是由于评分矩阵的稀疏,对于缺少数据的用户难以生成合适的推荐结果。然而除了评分,还有许多的辅助信息能够有助于挖掘用户的兴趣偏好。关于用户、物品或者行为环境的信息都可能影响用户对物品的喜爱程度。图模型作为一种直观描述变量间相互关系的方法正被越来越多的应用到推荐系统中。基于图模型的算法能够灵活引入新变量并对变量间的相互关系进行建模。本文基于图模型算法对如何利用评分信息以外的辅助信息提升推荐效果进行了研究。本文首先提出了引入种类信息的基于矩阵分解的偏好感知算法。目前,大多数矩阵分解推荐算法通过引入偏差项表征出用户评分行为的系统性偏向,但是并不能捕获评分中隐含的用户和物品之间的关系。而本文提出的引入种类信息的偏好感知推荐算法在矩阵分解的框架下引入变量对用户偏好进行建模,捕获用户与物品之间的偏好。算法中用高斯先验分布生成用户的隐藏特征向量和电影的隐藏特征向量。根据已知种类信息的不同,用户和电影的隐藏特征向量的生成方式不同,一个由单独的高斯分布生成,另一个由混合高斯分布生成,然后通过加入偏好因子改善评分预测的准确度。在两个MovieLens数据集上进行的实验结果表明,引入种类信息的偏好感知推荐算法能有效利用种类信息提升推荐效果。相关研究成果已发表在2016年12月在美国阿纳海姆举办的国际会议The 15th IEEE International Conference on Machine Learning and Applications(ICMLA)中。本文还提出了引入文本信息基于主题模型的推荐算法。传统的推荐算法无法利用物品的文本信息进行推荐。为此,本文提出一种基于主题模型的推荐算法,从含有文本信息的数据中提炼出电影的主题以及用户的兴趣,根据电影主题的分布与用户兴趣分布的相关性完成推荐。本文提出的基于R-LDA模型的推荐算法可以同时处理用户评分数据和电影的文本描述信息。R-LDA模型在对电影的文本信息进行主题建模的同时将用户兴趣和电影的文本描述信息关联上,挖掘出用户评分与用户兴趣和电影主题之间的联系。实验结果表明,在top-N推荐中,基于R-LDA模型的推荐方法能有效利用文本信息提升推荐效果。

其他文献

喹啉反硝化降解反应器关键菌和关键降解基因的探究

焦化废水中,难降解物喹啉及其衍生物是常见的含氮杂环污染物,因其有毒性、潜在致癌、致突变,因此研究喹啉降解十分必要。在过去四十年间,好氧条件下的喹啉降解研究报道较多,

学位

喹啉降解反硝化功能冗余细菌群落抗生素

miR-13664与蚊抗药性关系的研究

媒介传播的疾病占所有传染病的17%。蚊作为重要的传播媒介,可以传播多种严重的蚊媒病,如疟疾、登革热、寨卡、脑膜脑炎等。目前,蚊媒病缺乏有效的疫苗和治疗药物,迫切需要有

学位

溴氰菊酯抗药性淡色库蚊miR-13664CYP314A1

平板运动试验中血压心率乘积与冠心病病变程度的相关性研究

目的:通过观察冠心病患者平板运动试验中血压心率乘积(rate-pressure product,RPP)的变化,探讨RPP对冠心病病变程度的评估价值。研究方法:根据严格的纳入标准和排除标准选取2

学位

冠心病血压心率乘积冠状动脉病变Gensini评分

2014-2018年中国家禽H10、H11亚型禽流感病毒的部分生物学特性研究

近年来,在禽流感病毒的流行病学监测中,不断从家鸭中分离到H10、H11亚型的禽流感病毒,为了更清楚的了解H10、H11亚型禽流感病毒最新的分布流行情况、来源以及致病性特点,对20

学位

禽流感病毒H10、H11亚型抗原性遗传演化感染性受体结合

邻苯二甲酸二（2-乙基己基）酯孕期暴露致子代小鼠肥胖及代谢的影响

邻苯二甲酸二(2-乙基已基)酯(Di-(2-ethylhexyl)phthalate,DEHP)作为邻苯二甲酸酯类(Phthalate esters,PAEs)代表性化合物之一,广泛应用于一次性塑料消费品、食品包装、聚氯

学位

DEHP孕期暴露肥胖代谢组学

具有生境复杂性与收获效应的多时滞捕食者—食饵系统研究

本文在具有Holling型功能性反应的捕食者—食饵系统的基础上引入生境复杂性效应、时滞效应和收获效应,建立了具有生境复杂性效应和收获效应的多时滞的捕食者—食饵系统.本文运用动力系统的相关知识对系统的动力学行为进行了研究,并通过数值模拟来验证理论分析的结果.首先,本文对一类具有生境复杂性效应和线性收获效应的多时滞的捕食者—食饵系统进行了研究,包括解的正有界性、平衡点的稳定性以及分支周期解的性质.研究

学位

捕食者-食饵系统生境复杂性效应时滞效应收获效应稳定性Hopf分支

二维带有反应扩散项的Feynman-Kac方程的数值算法

最近,[Hou and Deng,J.Phys.A:Math.Theor.,51,155001(2018)]推导了一种向后的带有反应扩散项的Feynman-Kac方程,本文对该方程的二维情形提出了一个有限差分离散格式.数值求解该方程的关键在于如何离散时间回火分数阶物质导数和回火的分数阶Laplacian两类非局部算子.这里,我们利用了卷积求积方法来离散时间回火分数阶物质导数,得到一阶和二阶的离散格

学位

二维的Feynman-Kac方程有限差分逼近卷积求积误差估计

入侵植物喜旱莲子草的土壤反馈作用研究

外来物种入侵威胁全球生态安全和农业安全,造成巨大经济损失。土壤生物在植物入侵过程中发挥着重要的作用。如植物能够改变土壤生物群落结构,从而调控后期植物生长,即植物-土

学位

土壤反馈作用生物入侵喜旱莲子草土壤真菌生物量抗逆性

蚊CYP6AA9体外降解溴氰菊酯的初步探索

蚊传播多种疾病,包括疟疾、登革热、日本脑炎等,严重危害人类健康。防制蚊媒可有效阻断蚊媒病的传播,化学防制是当前蚊媒防制的主要手段之一。然而随着杀虫剂长期、大量的使

学位

细胞色素P450蚊抗药性基因CYP6AA9体外降解溴氰菊酯

内质网应激状态下慢性淋巴细胞白血病细胞外泌体调节巨噬细胞表型的机制研究

背景:慢性淋巴细胞白血病(Chronic lymphocytic leukemia,CLL)是西方国家最常见的白血病类型,该疾病目前仍不可治愈。B细胞受体(BCR)信号途径的活化和微环境的因素均在CLL的

学位

慢性淋巴细胞白血病内质网应激外泌体巨噬细胞热休克蛋白72

基于图模型引入辅助信息的推荐算法研究

与本文相关的学术论文