论文部分内容阅读
随着全球定位系统的发展和以智能手机为代表的移动终端的流行,基于位置的社交网络应用吸引了数千万的用户。在基于位置的社交网络中,人们可以分享签到地点等地理位置信息,大量用户产生的海量数据为研究人员研究用户的各种社交行为提供了机会,这其中基于用户签到数据预测用户的社交关系则成为研究热点,研究人员为此开展了大量的研究。本文围绕如何从用户的签到数据中挖掘出高效的特征以提高用户社交关系预测方法的性能展开研究,提出了三种基于位置的用户社交关系预测方法,主要研究内容和贡献如下:·基于时空特征的用户社交关系预测方法(STIF)为了解决过去研究工作中广泛使用的地点熵不能随着时间段的变化而动态计算地点流行度的问题,该方法提出了细粒度的地点权重特征。除此之外,该方法还从细粒度的时间特征、工作日和周末签到特征、共现地点的距离特征三个角度展开设计了13个特征,用以全面捕捉好友对之间的相似性与非好友对之间差异性。·结合隐式与显式特征的用户社交关系预测方法(CIFEF)为了解决包括STIF方法在内的用户社交关系预测方法依赖于大量特征工程的问题,提出了结合隐式与显式特征的用户社交关系预测方法CIFEF。该方法认为同一用户在工作日和周末有着截然不同的轨迹模式,因此把用户的签到轨迹划分为工作日签到轨迹和周末签到轨迹,然后分别利用skip-gram模型从用户的签到轨迹中学习用户的工作日和周末隐式向量,最后通过交互层把每对用户对应的工作日隐式向量与周末隐式向量做交互,以增强特征的表达能力。此外,CIFEF还设计了一个显式特征t wcl e用于与隐式特征的互补,该显式特征通过把一对用户在同一地点的签到时间差异引入到地点熵中,以此更好地度量用户对的某个共同签到地点的重要性。该方法结合隐式与显式特征,使用机器学习算法建立用户社交关系预测模型。·基于孪生神经网络的用户社交关系预测方法(simFriends)考虑到CIFEF方法中skip-gram模型无法捕捉用户签到轨迹中地点的顺序关系,提出了基于孪生神经网络的用户社交关系预测方法simFriends,该方法从用户的签到轨迹和用户与用户之间的间接交互关系两个角度出发,首先采用LSTM网络直接对用户的签到轨迹建模,LSTM网络能够很好的捕捉用户签到轨迹中地点的顺序关系。此外,在用户的签到数据中构建了“用户—地点”二分图,采用随机游走在二分图中产生与每个用户有间接交互关系的用户序列,然后利用Embedding技术对用户序列进行建模。最后采用孪生神经网络的思想,分别计算两部分向量的欧氏距离,并采用对比损失作为损失函数来训练网络模型。最后,在两个公开且真实的数据集上实施了大量实验并与当前基于位置的用户社交关系预测领域中的前沿方法做了对比,结果表明了本章提出的三种基于位置的用户社交关系预测方法的有效性及优越性。