基于三部图和时间效应的推荐算法研究

来源 :西南石油大学 | 被引量 : 0次 | 上传用户:hongguoqwer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术和互联网的发展导致信息总量急剧膨胀,人们已经从信息匮乏的时代进入了信息过载的时代。信息过载对用户和信息生产者都提出了很大的挑战:对于用户来说,从海量的信息中找到有价值的信息变得相当困难;对于信息生产者来说,他们生产的信息也很难得到用户的关注。在众多信息过载问题的解决方案中,推荐系统脱颖而出,它能够根据用户的历史行为数据分析用户兴趣,自动地为用户推荐他们可能感兴趣的物品。推荐系统通常利用用户行为数据、标签和上下文信息来预测用户评分或者为用户推荐物品。本文主要研究三部图中不同信息组合方式对于推荐结果质量的影响;提出了一种同时考虑用户长期和短期兴趣的类型概率算法(Type Probability),进一步考虑时间效应为用户进行推荐。第一,本文构造了关于评分信息和标签信息的三部图,根据不同信息的组合提取了十种推荐算法。前两种算法只考虑用户和物品之间的关系,为传统的协同过滤算法。中间四种算法分别以用户或物品为中心,利用评分信息和相应的标签信息来预测用户评分或生成推荐列表。最后四种算法只考虑不同类型的标签信息,利用标签信息进行评分预测和Top N推荐,为基于标签的推荐算法。本文分析了以上十种算法的时间复杂度,使用平均绝对误差(MAE)和均方根误差(RMSE)对比了十种算法评分预测的准确度。在Top N推荐方面,比较了不同算法Top N推荐结果的准确率(precision)、召回率(recall)和覆盖率(coverage)。在MovieLens 100K和MovieLens 1M上的实验结果表明:物品标签-物品-用户的信息组合最佳;使用线性融合后的信息能够有效地提高算法评分预测和Top N推荐的质量。第二,模拟推荐系统真实运行场景,进一步研究了时间上下文信息对于推荐结果的影响。本文提出了同时考虑用户短期兴趣和长期兴趣的类型概率算法,比较了三种非个性化推荐算法和四种个性化推荐算法Top N推荐的命中率(hitratio)。在MovieLens 100K上的实验结果表明:时间上下文信息对于提高Top N推荐命中率至关重要;在考虑时间效应后,时下热门算法的命中率要高于其他算法,本文提出的类型概率算法在特定时间窗口下的能有效提高推荐的命中率。
其他文献
目的:急性椎体骨折在老年患者中常见,最常发生在胸腰段椎体,椎体骨折后患者临床症状明显,主要是难以忍受的疼痛以及活动受限,导致患者的生活不能自理。目前临床上最常应用微创手术-经皮椎体成形术(percutaneous vertebroplasty,PVP)治疗急性椎体骨折患者,通过PVP手术可以稳定责任椎体,快速有效的缓解患者疼痛症状,使患者早期康复。PVP术中完成穿刺责任椎体、灌注骨水泥以及术后查看
近年来,随着信息时代的发展,越来越多的学者将社团检测应用到社交网络分析、网络可视化、社交关系的推荐系统等具体问题中。社团是由节点和节点之间的连边所构成的聚簇结构。社团结构能够帮助我们更好地检测到网络中内部隐含的信息。面对着爆炸式的数据,如何充分地利用和挖掘这些隐含的数据信息是当前学者们所关注的问题。博弈论是研究游戏玩家之间策略相互作用的理论。它可以用来解释社团在复杂网络中的形成过程。近年来,不少的
在自然界中,同步现象比比皆是。科学家们对同步现象进行了深入的研究,并将同步研究成果在物理、生物和经济等领域进行应用。随着复杂网络科学的迅猛发展,人们越来越多的将动
期货的收益和风险评估是金融资产评估理论研究的重要组成部分,而对股指期货在股灾中作用的考察正是对金融资产评估理论的补充和丰富,有着极高的研究价值。股指期货具有流动性
随机数认证在量子信息处理任务中至关重要。具有非局域性的量子态可用来认证随机数,量子态的纠缠性是量子非局域性的重要资源。因此,判断量子态的纠缠性(一般采用纠缠目击形
随着现今世界工业化程度逐步提高,工业生产规模逐步扩大,许多大型工业过程中的工艺流程也变得越来越复杂,并且这些过程通常会存在多变量、强耦合和强非线性的特征,这使得基于
很显然,金融危机源自于自身体系的不稳定和无效率。因此,关注面向银行业可能爆发的问题以及持续存在的特性(稳定与效率),来避免全球性的金融危机(传染效应)。我们发现的稳定
公司上市意味着得到更多的融资机会,从而可以解决发展资金短缺问题,获得更多的发展机遇。然而,对于公司而言,上市不仅要付出巨大的成本,还要依法履行信息披露义务,而信息披露
党的十九大以来,对资本市场的发展提出了更高的要求。2018年金融工作会议上强调坚持新的发展理念,要以保护投资者合法权益为根本使命,抓好服务实体经济、防范风险和深化改革
Hadoop分布式计算框架有效解决了大规模数据并行处理中数据的存储与计算问题,集群资源分配及调度方式对于提高系统的整体性能具有重大的现实意义。目前,相关学者在提高数据本