论文部分内容阅读
个性化推荐算法利用用户在电子商务网站中的行为,用户的人口统计学信息等为用户推荐其感兴趣的商品,因而在企业中得到广泛的应用。但是随着商品数量的爆炸式增长,数据的稀疏性给推荐算法的精度带来了巨大的挑战。个性化推荐算法的研究开始涉及到用户在社交网站中的信息,通过跨领域的用户兴趣建模,为用户提供多样化的更精确的推荐结果。基于兴趣的推荐提升了推荐算法的精度,也提升了推荐的效率。随之而来的问题是,用户的兴趣会随着时间不断地发生变化。已有的对于用户兴趣变化的研究单纯地考虑时间因素对用户兴趣的影响,采用线性的时间模型来衡量,但是用户兴趣的“遗忘”是一个不均匀的过程。或者单纯考虑用户在社交网站中受到其他用户影响而兴趣发生变化,但只有当用户在接收到影响并做出反馈(如转发、评论信息)时,才表明信息对应的用户兴趣发生了变化。与此同时,用户兴趣在社交网络中的传递受到用户影响力权值的作用,传统的对于信息扩散中用户影响力的计算采用的方式只考虑了用户发布信息的规模或者数量,无法全面地给出用户的信息。另外,用户的兴趣的变化还受到其在电商网站中的消费行为的影响,也就是说用户的兴趣是综合了自身行为、时间因素及网络空间因素的三元组,兴趣的演化也必须将三个方面结合起来。而综合个体、时间与网络空间的兴趣图谱演化机制的研究主要面临的问题是:(1)用户在电商网站中的行为对其兴趣的影响,以及如何将商品与用户兴趣关联起来;(2)用户的某个兴趣受到影响而发生变化,也会对与其语义相似度很高的兴趣产生影响,这个过程用传统的扩散激活理论无法完成;(3)用户在网络空间中的影响力的计算需要将用户在社交网络中发布或者浏览的信息与用户的兴趣概念关联起来;(4)将用户行为、时间及网络空间综合起来,如何表达实际的用户兴趣图谱的演化过程从而进行个性化推荐是一个难题。针对以上提出的问题,本文提出了融合个体-时间-空间的用户兴趣图谱演化机制,包括个体行为引起的用户兴趣演化,因时间引起的用户兴趣的衰减,网络空间中的用户兴趣演化,完善了用户兴趣变化的进程。主要工作包括:(1)提出了在线社会网络中的兴趣扩散激活模型。(2)依据语义扩散的路径将用户兴趣在其兴趣图谱本体内部的扩散分为深度扩散、广度扩散及多向链接扩散。(3)建立用户消费行为模型,借助语义词典与开放关联数据集,综合考虑商品与商品属性或标签将商品与用户兴趣概念关联起来,从而获取用户兴趣的演变。(4)考虑用户所在社交网络的网络网络拓扑结构,并利用语义词典及已有兴趣本体将用户所发布的信息与兴趣概念相关联,提出了网络空间中的用户影响力计算方法。(5)综合提出的算法与模型,建立融合个体-时间-空间的用户兴趣图谱演化机制。涵盖从个体行为到社交网络,从兴趣图谱本体内部到时间引起的兴趣变化,完成了整个兴趣图谱演化的过程。(6)在本文的提出的算法的基础上,收集用户数据,利用传统的基于扩散激活理论的用户兴趣图谱演化的结果进行个性化推荐,同时与本文兴趣图谱演化进行推荐的结果对比,证明本文提出的算法大大提升了推荐精度与结果的多样性。