论文部分内容阅读
移动互联网技术的爆炸式发展和北斗导航系统的出现,使用户可以涉足世界上几乎全部地区,产生了大量的带地理位置标签的多媒体信息,形成了位置社交网络。为了给用户推荐感兴趣的地点,方便用户出行和合理分配社会资源,位置推荐系统成为热门的研究方向。传统的位置推荐系统通常采用协同过滤或者矩阵分解的方法,计算每个位置的得分,为用户推荐。然而,以上方法利用one-hot签到向量计算用户相似度,不能很好地处理数据的稀疏性问题,当用户仅有少量的签到时,计算的相似度几乎没有任何可信度,推荐性能往往很差。在冷启动问题上,甚至出现了更差的结果。通过挖掘用户签到数据中的时间、空间和社交等上下文信息,不仅能够从不同维度提供良好的个性化推荐性能,并且能够减少稀疏性和冷启动问题的影响,提供更好的用户体验。本文首先分析了位置社交网络中的用户签到数据的空间属性和时间属性,从数据分析中概括出用户签到的空间聚类模式和时间转移规律,然后提出了一种混合的位置推荐系统的方法,主要贡献和创新包括:(1)在空间要素方面,为了防止个性化兴趣点被热门兴趣点淹没的问题,把层次聚类和二维核密度估计结合起来。对用户的签到地点按照距离进行空间层次聚类,自动获得用户频繁出现的多个聚类中心,进而在每个用户聚类内以经纬度坐标做二维核密度估计,最终平均各签到聚类上的核密度估计值。(2)在时间要素方面,为了解决稀疏性问题,利用一阶位置转移矩阵实现了用户特征的全网络游走。利用每个用户签到序列以及时间间隔,构建出所有签到位置的转移概率矩阵,同时结合用户关系矩阵和用户签到矩阵,利用改进的带重启的随机游走方法,不断传递用户的偏好,得到用户访问各兴趣点的稳态概率。(3)在社交要素方面,为了缓解好友密集签到对用户偏好得分的影响,改进了协同过滤,并提出了融合多要素的混合推荐方法。改进基于社交的协同过滤方法建立用户依靠好友而形成的兴趣。最后,综合空间偏好,时间偏好和社交偏好,提出一个混合推荐方法计算用户的兴趣点访问概率,对冷启动问题帮助很大。最后实验结果的分析表明,本文提出的混合推荐方法在准确率和覆盖率指标上均优于目前常用的基准方法,并且能够一定程度上缓解冷启动和数据稀疏性的问题。