论文部分内容阅读
基于位置社交网络中的兴趣点推荐能够根据用户的签到偏好有效地帮助用户探索未访问过的地点,通过提供个性化的兴趣点推荐服务来解决地点信息过载的问题,具有重要的研究意义和应用价值。但是,现有兴趣点推荐方法在如何深入进行用户自身签到行为多样性的研究、如何实现融合时间特征和空间特征的自适应兴趣点推荐算法、如何利用循环神经网络实现自适应连续兴趣点推荐算法、以及如何提高兴趣点推荐算法的性能等方面还存在不足之处。针对这些问题,本文围绕用户签到行为和自适应兴趣点推荐算法展开研究,主要工作如下。首先,针对现有兴趣点推荐对用户的签到行为考虑不足,缺乏对用户分类的问题,提出用户签到行为的特征提取方法及用户聚类算法。采用概率统计分析方法,从LBSNs历史签到数据集中提取和分析用户签到次数、签到兴趣点数量和签到时间槽分布数量三维特征。在此基础上,提出基于模糊C均值的用户聚类算法,采用三种指标综合分析聚类的性能,确定最佳聚类数目并给出用户聚类的结果及现实涵义。实现对用户自身签到行为特征和用户聚类的深入全面研究,为下一步设计自适应兴趣点推荐算法奠定坚实基础。其次,针对基于用户协同过滤的方法无法准确获取用户签到偏好的时间特征,缺乏自适应推荐策略的问题,提出一种基于时间特征和用户协同过滤的自适应兴趣点推荐方法。时间特征对兴趣点推荐有重要影响,通过时间的可变性和相关性特征提取与分析,把时间槽的平滑技术融入到用户的相似度计算中,从而在协同过滤中体现用户签到的时间偏好特征,并解决数据稀疏的问题。根据用户之间的相似性特征提取与分析,提出基于阈值过滤的相似用户近邻选择方法,有效缓解用户相似度的计算量,提高用户之间联系的紧密性。针对不同签到特征的用户提出相应的策略进行兴趣点推荐,实现算法的自适应性。再次,针对空间概率模型推荐方式较单一,并且与用户签到时间偏好的关联较弱问题,提出一种融合时空特征和概率模型的自适应兴趣点推荐方法。通过对兴趣点流行度的特征提取和分析,提出结合整体效应和时间感知的兴趣点流行度计算方法。通过对相邻签到兴趣点的距离特征建模和分析,对LBSNs中大量的兴趣点进行过滤预处理,得到候选兴趣点集合,从而提高兴趣点的空间关联度,降低推荐计算的复杂度。通过在兴趣点推荐算法中选择采用不同的空间模型策略,即时间感知的一维幂律函数概率模型或时间感知的二维高斯核密度估计概率模型,实现针对不同签到行为特征用户的自适应推荐。然后,针对已有连续兴趣点推荐方法难以准确体现用户的短期兴趣偏好,以及无法适用于签到行为不活跃用户的问题,提出一种结合长短期兴趣偏好的自适应连续兴趣点推荐方法。该方法将用户的兴趣点签到轨迹序列按照时间窗口划分为近期签到轨迹序列和历史签到轨迹序列,并分别采用循环神经网络模型和长短期记忆网络模型来建模获取用户的短期和长期兴趣偏好。对于签到行为不活跃的用户,提出一种签到轨迹序列填充的方法,将活跃相似用户的近期签到记录,填充到不活跃用户的近期签到轨迹序列中,利用循环神经网络模型对该序列进行建模将获取到的兴趣偏好作为不活跃用户的短期兴趣偏好,该方法能够有效解决不活跃用户连续签到轨迹序列较短和冷启动的问题。最后,为了验证本文提出的自适应算法的有效性,在Foursquare和Gowalla数据集上进行多个POI推荐算法的实验,并依据推荐精度、召回率、F_β指标、时间平均绝对误差、算法运行时间、训练集可扩展性等指标进行性能对比分析和评价。大量实验表明,本文所提方法的性能均优于对比的基准方法。