融合多源信息的推荐算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhou20p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网相关技术的不断发展,从海量数据中找到有价值的信息变得越来越困难,即用户面临严重的信息过载问题。推荐算法通过分析用户的历史活动数据,挖掘用户的隐藏偏好,为用户提供个性化的推荐服务,成为解决信息过载问题的有效手段,近年来受到学术界和工业界的广泛关注。在实际应用中,推荐算法面临各种挑战,如数据稀疏、可扩展性、冷启动、准确性、可解释性等。针对这些挑战,国内外的研究人员提出了大量的解决方案。然而,仅仅利用用户的活动记录信息不能从本质解决推荐系统中存在的固有问题。近年来,多种类型的多源信息越来越丰富,如项目属性信息、社交网络信息、地理位置信息和用户评论信息等。可用的多源信息是用户历史活动记录的有益补充,为解决推荐系统中信息缺乏问题带来契机。同时,如何在推荐系统中融合多源信息,提升推荐算法的性能,解决推荐系统存在的问题,成为推荐系统领域重要的研究问题。在本文中,我们主要针对推荐系统中数据稀疏、可扩展性、冷启动和准确性等问题,在现有工作的基础上,结合协同过滤推荐算法、基于社交网络推荐算法和兴趣点推荐算法等领域的现有成果,研究融合多源信息的推荐算法。本文的主要工作和贡献如下:1.基于项目属性耦合的矩阵分解推荐算法现有一些基于矩阵分解的推荐算法仅关注用户端的冷启动问题,而忽视项目端的冷启动问题。并且,缺乏有效的度量方式计算由类别型数据所描述的项目之间的相似度。为了解决以上问题,本文提出基于属性耦合的矩阵分解推荐算法。在矩阵分解模型中,集成项目的属性信息来改进推荐算法的性能,减轻项目端的冷启动问题。利用属性信息构建正则化项,约束矩阵分解学习隐特征向量,使得属性信息相似的项目,它们的隐特征向量尽可能相似。在构建包含属性信息的正则化项时,利用耦合对象相似度计算项目之间的相似度。实验结果表明,基于属性耦合的矩阵分解推荐算法性能优于目前主流的推荐算法,能有效减轻项目端的冷启动问题。2.融合用户社会地位和矩阵分解的推荐算法随着社交网络的出现,越来越多的推荐系统利用社交网络中用户之间的信任关系来改进推荐算法的性能。然而,现有基于社交网络推荐算法忽略了以下两个问题:(1)在不同的领域中,用户通常信任不同的朋友;(2)由于用户在不同的领域内具有不同的社会地位,因此,用户在不同的领域内受朋友的影响程度是不同的。为了解决以上问题,本文首先利用整体的社交网络结构信息、和用户的评分信息推导特定领域社交网络结构,然后利用PageRank算法计算用户在特定领域的社会地位,最后提出了一种融合用户社会地位信息的矩阵分解推荐算法。实验结果表明,本文提出融合用户地位信息的矩阵分解推荐算法的性能优于传统的基于社交网络推荐算法。3.基于地点重要性和用户权威性增强的兴趣点推荐算法智能移动设备的普及、GPS和WEB2.0等技术的发展促使基于位置的社交网络平台不断涌现。兴趣点推荐从基于位置的社交网络应用提供的多源信息源中挖掘用户兴趣偏好,为用户推荐用户可能感兴趣的、未访问过的地理位置,已经成为基于位置的社交网络应用不可或缺的组成部分。一些研究人员将兴趣点看作传统推荐领域中的项目,提出了一些兴趣点推荐算法。然而,不同于传统领域的推荐,兴趣点推荐具有一些独特的属性,已有的兴趣点推荐算法存在如下的问题:(1)多数已有的兴趣点推荐算法简化用户签到频率数据,仅使用二进制值来表示用户是否访问一个兴趣点;(2)基于矩阵分解的兴趣点推荐算法把签到频率数据和传统推荐系统中的评分数据等同看待,使用高斯分布模型建模用户的签到行为;(3)较少研究工作考虑地点重要性和用户权威性对用户签到行为的影响。为了解决上述问题,本文集成概率因子模型和地点重要性来建模用户的签到行为,提出了地点重要性和用户权威性增强兴趣点推荐算法。具体地,同时考虑用户经验和兴趣点之间的相互影响,以及兴趣点之间的相互影响,采用HITS和PageRank混合模型计算地点重要性和用户权威性。而且,将用户权威性作为个性化因子衡量用户的隐式反馈。实验结果表明,地点重要性和用户权威性增强的兴趣点推荐算法性能优于基准兴趣点推荐算法。4.基于Ranking的泊松矩阵分解兴趣点推荐算法除了简化用户签到数据,仅使用二进制值表示用户是否访问兴趣点,以及将签到频率数据和传统推荐系统中的评分数据等同看待外,已有的多数兴趣点推荐算法忽视用户签到数据的隐式反馈属性,即,仅采用逐点拟合可观测签到数据的方法学习用户和兴趣点的隐特征向量,忽视了用户签到数据之间的偏序关系。为解决以上问题,本文提出一个基于Ranking的泊松矩阵分解兴趣点推荐算法。首先,根据基于位置社交网络中用户的签到行为特点,利用泊松分布模型替代高斯分布模型建模用户在兴趣点上签到行为,然后采用BPR标准优化泊松矩降分解的损失函数,拟合用户在兴趣点对上的偏序关系。最后,利用包含地域影响力的正则化因子约束泊松矩阵分解的过程。实验结果表明,基于Ranking的泊松矩阵分解兴趣点推荐算法的性能优于传统的兴趣点推荐算法。
其他文献
参与式教学法是提高思想政治理论课教学效果的一种有效方法.在高校思政理论课堂运用参与式教学法是必要的,本文探讨如何运用参与式教学模式来提升思政课教学效果,以更好达到
中国是世界著名的农业大国,全国农民人口占总人口的80%,因此农村的经济建设显得至关重要。另一方面,农村区域发展的状况在一定程度是一个国家和社会进步的标志,所以推进新农
目的:观察丙磺舒对阿莫西林在健康家兔体内药动学的影响。方法:采用微生物杯碟法测定兔血清中阿莫西林的浓度。结果:阿莫西林单剂量肌内注射后,吸收迅速,Tmax=(0.78±0.09)h,Cmax=(0.8
目的探讨综合护理方法在新生儿真菌感染类疾病中的护理效果。方法回顾性总结我院收治的发生真菌感染类疾病新生儿的护理资料56例,按照护理方法不同分为两组:选择综合护理方法
有机硼高分子化合物是高分子化学中的一个新的领域,由于硼化合物的特殊性能,在导电介质中的应用价值也逐渐为人们所发现,在导电介质中得到了广泛的应用。本文采用正交实验和
镇痛药研究引入了细胞及分子生物学的最新研究手段和方法,并从神经激肽类阻滞剂、N—甲基—D—天门冬氨酸(N-methyl-D-aspartate,NMDA)受体阻滞剂、腺苷激酶抑制剂、脑啡肽分
基于Web of Science和CNKI数据库,对2003-2018年国内外发表的有关学术英语阅读的科研论文进行梳理与分析,研究表明该领域研究虽然起步较晚,但研究整体呈上升趋势。从四个方面
<正>一百多年来,中国思想文化界的先驱们一方面对传统戏曲进行了激烈的、深刻的批判,另一方面引进西方戏剧艺术,试图改造传统戏曲。在这一过程中,人们取得了很大的成绩,同时
叙述了电磁流量计励磁技术的发展史,着重探讨各种励磁技术的特点、工作原理和典型励磁电路,总结了各种励磁技术的应用范围,阐述了国内外电磁流量计励磁技术的现状和发展趋势