论文部分内容阅读
随着智能移动设备的广泛应用,人们的日常行为很容易被拥有位置记录功能的设备所获得并存储。被记录的这些位置数据不但清楚地标识了用户所在的物理位置,而且还隐含了用户的一些潜在信息。如果对这些物理位置中显著地点进行挖掘和分析,可以进一步发现用户的兴趣和偏好、用户的工作性质、城市资源分布情况等等。因此,对显著地点所隐含的信息进行挖掘研究具有重要的理论和实际意义。已有的显著地点挖掘算法的研究通常基于条件过滤、聚类或者数学模型方法,存在着准确度不高、计算开销大、容错率低和解释性差等缺点。为此,提出了一种基于移动特征的显著地点挖掘方法MMC(Mining based on Movement Characteristic)。首先,根据用户在实际中的移动特征,确定“徘徊”状态临界阈值;其次,计算用户轨迹中各位置的瞬时速度,并排除其中速度高于“徘徊”阈值的连续噪声段,紧接着由每一段徘徊轨迹生成候选地点;最后,将实际中相同的候选地点进行合并,得到用户的显著地点列表。为了验证算法的有效性和正确性,实验采用由Geo Life项目真实采集的用户移动数据为数据集。利用MMC来进行显著地点的挖掘,并与K-Means方法进行了对比,实验结果表明,MMC能更加准确的从GPS移动轨迹中挖掘出用户的显著地点,而且效率较高。以显著地点挖掘研究成果为基础,研究了MMC算法在推荐系统中的具体应用,即根据用户的显著地点列表发现相似用户。首先,以MMC算法挖掘的显著地点为特征,结合访问频率和访问时间区间两大影响因素,定义用户-地点相关度,度量用户与显著地点之间的相关性;其次以用户与显著地点列表中所有地点的相关度构建用户相关向量,描述用户特征;然后,将两个用户的显著地点列表合并,计算各用户基于该集合的相关向量;最后,根据相关度和相关向量乘积法则运算得到用户之间的相似度。使用该方法对MMC的挖掘结果抽样进行相似用户的发现,对比用户地点列表在地图中的分布,结果表明,该方法能更好地发现相似用户。