论文部分内容阅读
随着智能设备的普及,GPS和Web2.0技术的发展,能够基于位置提供服务的应用程序应运而生。基于位置的社交网络(Location-based Social Network,LBSN)也变得流行起来,用户可以轻松地访问LBSN应用程序,并在自己感兴趣的兴趣点(PointofInterest,POI)留下足迹,比如用户感兴趣的餐厅、酒店、剧院等。然而,随着城市的发展,人们生活的物理边界不断被拓宽,大量的兴趣点被开发,“去哪里”变成了一个严重困扰用户的大问题。个性化POI推荐的出现,帮助用户过滤掉不感兴趣的兴趣点,减少决策时间,以提高用户的体验。
不同于Netflix中的电影推荐,交友网站中的好友推荐,网上购物中的商品推荐,LBSN中的兴趣点推荐由于人移动的随机性,LBSN中数据的稀疏性、异构性等问题,使得兴趣点推荐具有独特的挑战性。许多学者通过利用LBSN中的好友信息、地理位置信息、签到序列信息、时间信息等来提高兴趣点推荐系统的性能,但是能综合利用多种信息来改进推荐系统性能的方法还比较少。
为了应对上述问题,本文提出了一种多信息嵌入和位置信息融合的兴趣点推荐算法。通过利用用户好友信息、兴趣点标签信息、用户签到序列信息、地理位置信息来建立一个统一的模型EmbGeoRec进行个性化POI推荐。本文主要研究工作如下:
(1)提出了一种基于LINE算法的图嵌入推荐算法LineRec。通过用户签到数据,用户好友数据,兴趣点的标签数据,建立三部图,即用户-好友-兴趣点图、用户-兴趣点-标签图。通过图嵌入算法LineRec,对三部图(用户-好友-兴趣点,用户-兴趣点-标签)进行训练,整合用户好友信息和兴趣点标签信息,得到用户对兴趣点的个人兴趣和社交兴趣评分。通过实验,得到算法的最佳参数设定。
(2)提出了一种多信息嵌入的联合推荐算法EmbRec。针对用户的签到信息,以及同一用户在两个连续签到的兴趣点签到的时间间隔△t,得到用户的签到序列。设计了一种基于word2vec算法的序列嵌入推荐算法SeqRec,通过序列嵌入算法,得到用户签到序列中的上下文信息,获取用户的签到规律。进而结合(1)中的图嵌入推荐算法LineRec,提出了一种多信息嵌入的联合推荐算法EmbRec进行兴趣点推荐。
(3)通过(2)中提出的联合嵌入算法EmbRec整合用户好友信息、兴趣点标签信息、用户签到序列信息,继而添加地理位置信息来建模,充分挖掘用户的个人喜好。具体来说,通过图嵌入算法LineRec,对三部图(用户-好友-兴趣点,用户-兴趣点-标签)进行训练,整合用户好友信息和兴趣点标签信息,得到用户对兴趣点的个人兴趣和社交兴趣评分。通过序列嵌入算法SeqRec,对用户的签到序列进行训练,整合用户的签到序列信息,得到用户的签到规律。另外,用户与兴趣点之间的距离也是相当重要的,通过Naive Bayesian算法,整合地理位置信息,得到用户在某个兴趣点签到的概率,并进行打分。最后建立一个统一的模型EmbGeoRec进行个性化POI推荐。通过在两种公开的真实数据集上进行实验,结果表明,本文提出的多信息嵌入和位置信息融合的兴趣点推荐算法EmbGeoRec与其他比较流行的兴趣点推荐算法相比,具有更好的推荐效果。
不同于Netflix中的电影推荐,交友网站中的好友推荐,网上购物中的商品推荐,LBSN中的兴趣点推荐由于人移动的随机性,LBSN中数据的稀疏性、异构性等问题,使得兴趣点推荐具有独特的挑战性。许多学者通过利用LBSN中的好友信息、地理位置信息、签到序列信息、时间信息等来提高兴趣点推荐系统的性能,但是能综合利用多种信息来改进推荐系统性能的方法还比较少。
为了应对上述问题,本文提出了一种多信息嵌入和位置信息融合的兴趣点推荐算法。通过利用用户好友信息、兴趣点标签信息、用户签到序列信息、地理位置信息来建立一个统一的模型EmbGeoRec进行个性化POI推荐。本文主要研究工作如下:
(1)提出了一种基于LINE算法的图嵌入推荐算法LineRec。通过用户签到数据,用户好友数据,兴趣点的标签数据,建立三部图,即用户-好友-兴趣点图、用户-兴趣点-标签图。通过图嵌入算法LineRec,对三部图(用户-好友-兴趣点,用户-兴趣点-标签)进行训练,整合用户好友信息和兴趣点标签信息,得到用户对兴趣点的个人兴趣和社交兴趣评分。通过实验,得到算法的最佳参数设定。
(2)提出了一种多信息嵌入的联合推荐算法EmbRec。针对用户的签到信息,以及同一用户在两个连续签到的兴趣点签到的时间间隔△t,得到用户的签到序列。设计了一种基于word2vec算法的序列嵌入推荐算法SeqRec,通过序列嵌入算法,得到用户签到序列中的上下文信息,获取用户的签到规律。进而结合(1)中的图嵌入推荐算法LineRec,提出了一种多信息嵌入的联合推荐算法EmbRec进行兴趣点推荐。
(3)通过(2)中提出的联合嵌入算法EmbRec整合用户好友信息、兴趣点标签信息、用户签到序列信息,继而添加地理位置信息来建模,充分挖掘用户的个人喜好。具体来说,通过图嵌入算法LineRec,对三部图(用户-好友-兴趣点,用户-兴趣点-标签)进行训练,整合用户好友信息和兴趣点标签信息,得到用户对兴趣点的个人兴趣和社交兴趣评分。通过序列嵌入算法SeqRec,对用户的签到序列进行训练,整合用户的签到序列信息,得到用户的签到规律。另外,用户与兴趣点之间的距离也是相当重要的,通过Naive Bayesian算法,整合地理位置信息,得到用户在某个兴趣点签到的概率,并进行打分。最后建立一个统一的模型EmbGeoRec进行个性化POI推荐。通过在两种公开的真实数据集上进行实验,结果表明,本文提出的多信息嵌入和位置信息融合的兴趣点推荐算法EmbGeoRec与其他比较流行的兴趣点推荐算法相比,具有更好的推荐效果。