论文部分内容阅读
随着互联网的发展,基于位置的社交网络(Location-Based Social Network,LBSN)服务得到了广泛地使用,如何在呈指数式爆炸增长的信息中帮助用户选择有用的消息已成为了重要的研究。与传统的推荐算法运用场景相比,LBSN中存在着更为复杂的上下文信息,例如用户出行时间信息、兴趣点地理信息、内容信息等,这些信息与用户出行的签到行为有着紧密的联系,如何充分利用这些上下文信息进行建模以更好地模拟用户出行的决策行为从而提高兴趣点推荐结果的质量是一个需要深入研究的问题。基于此,本文主要的研究内容有以下几个部分:(1)本文提出了一种新的时空主题模型STSTM(Sequential Temporal-Spatio Topic Model)。STSTM能探索根据时间改变的潜在主题以及潜在地区。即时间因素作为影响主题以及地区的上游因素。STSTM使用连续的时间而非离散化的时间作为建立模型。为了体现以往的签到选择对下次签到选择的影响,STSTM将每次签到的时序影响整合进模型中。通过利用潜在狄利克雷分配(Latent Dirichlet Allocation,LD A)模型挖掘潜在主题、时间间隔以及潜在地区的概率,与预测签到地点的时序影响相结合,产生下次签到的预测列表。该文在一个真实LSBN签到数据集上进行实验,结果表明该算法相比其他先进的兴趣点推荐算法具有更好的推荐效果。(2)本文提出了一个基于时间模式的联合概率生成模型TJM(Temporal Joint Model)来模拟用户在决策过程中的签到行为,该模型策略性地整合了上述因素,并就如何充分利用。为了证明该模型的适用性和灵活性,本文研究了它如何统一地支持两种推荐模式,即工作日推荐和假期推荐。本文在两个真实的大规模数据集上进行了大量的实验,从推荐有效性和推荐效率两个方面对模型的性能进行了评估,实验结果显示了它优于其他竞争对手;(3)为了利用签到评论这一特性,本文提出了基于用户社交网络与评论情感分析的主题模型(SAETM)。SAETM可以从两个角度捕获签到行为中的用户兴趣:用户社交网络与评论分析。首先利用潜在狄利克雷分配模型挖掘兴趣点相关的文本信息;然后通过用户社会关系构建社会相关性生成社会相关分数。最后利用概率模型将地理、时间、社会、兴趣的相关分数进行有效地融合,从而生成推荐给用户的推荐列表。该文章基于一个真实LBSN签到数据集进行试验,从推荐有效性对模型的性能进行了评估,实验结果显示了它比其他兴趣点推荐算法具有更好的推荐效果;(4)基于提出的三种兴趣点推荐模型的基础上,本文设计并实现了兴趣点推荐系统。该系统融合了多种个性化推荐算法,可结合用户的签到数据,为用户提供不同出行签到场景下的兴趣点推荐,满足用户的需求,提高用户体验。