论文部分内容阅读
随着智能移动设备的普及和全球定位系统(Global Positioning System,GPS)的发展,人们能更加便捷迅速的获取实时位置信息,这也使得基于位置的社交网络越来越受欢迎。比如Foursquare,Gowalla,Brightkite等等,这些实时在线系统鼓励用户在朋友圈分享他们的生活经历和在访问有趣的位置时进行实时签到。如今,人们的生活移动轨迹不仅仅受周边同事、朋友的影响,更多会参考在社交网络上朋友的分享,这将使得基于位置的社交成为一种社交的潮流,同时为激励人们探索自己感兴趣的未知地点创造了机会。虽然基于位置的社交网络(Location-based Social Network,LBSN)推荐系统得到了广泛的研究,但是大多数的研究工作和方法都聚焦于显式反馈数据的场景,却忽视了基于隐式反馈数据的研究。在网络发达的今天,人们可以随时随地的签到,然而产生的大多数签到数据都为隐式反馈数据,只包含一些基本签到信息(游览记录,时间,地点)和签到留下的历史记录。其中大多签到数据缺少明确的用户偏好信息(例如喜欢某地,不喜欢某地),进而导致了基于隐式反馈的推荐变得复杂起来。本文通过挖掘基于位置的社交网络中隐式反馈签到的特点,对基于隐式签到的兴趣点推荐进行了相关的研究,本文主要的贡献如下:1.本文引入地理时空距离度量模型,将时间与空间信息映射到一个三维椭圆球坐标系中,将时间距离和空间距离映射到统一尺度进行度量,采用核函数加权为时空距离予以不同权重。在同一参考标准下测量时空距离,有助于缓解冷启动和数据稀疏对于位置推荐精度带来的问题。同时基于贝叶斯个性化排名,设计了一个新颖的基于时空距离度量的加权贝叶斯个性化兴趣点排名推荐方法,很好的统一了时空变换对兴趣点迁移的影响。在两个数据集Brightkite和Gowalla上的实验验证都有很好的表现,明显优于对比基准方法。2.本文通过分析隐式反馈的特点,提出了一种在时间效应下基于社会关系、个人偏好与时空上下文的通用位置推荐框架,来捕获用户在隐式反馈中移动行为的特点。对于空间分布,利用层次聚类算法对空间位置进行基于距离的层次聚类,产生不同个子类,然后通过核密度估计算法计算用户第k个位置聚类的核密度估计。对于时序分析,将时间进行细粒度的划分,根据人们的生活习惯将时间划分为以天和以周为单位的循环模式,进而把每天分成不同时间段,每周划分为工作日与非工作日。对于社交朋友影响,生成与用户相关好友的邻接矩阵,采用Jaccard计算好友相似度。最后提出了融合空间位置分布相关性和在时间效应下的时间-个人-社交朋友相关性的统一兴趣点推荐模型框架。