论文部分内容阅读
随着通讯技术与网络技术的飞速发展,出行轨迹数据的获取成为可能,其形式也变得更加多样化,而针对个体出行轨迹的研究近年来也成为一个热门领域。我们可以从个体出行轨迹中获取时空信息,并通过和地表信息相结合,推断出轨迹的出行信息,因此在个体出行轨迹数据集中,我们可以挖掘到许多有用的知识和模式,并将其应用于城市规划、交通管理等多个领域中。 近年来针对个体出行轨迹的研究也越来越多,其研究方法主要集中在三个方面:基于单一属性的统计学方法、基于时间地理学的分析方法以及基于时空轨迹聚类的数据挖掘方法。几种方法均能够从个体出行轨迹数据中获取许多知识,并根据研究目的的不同进行不同的分析与应用,但这些方法都存在一定的局限性,我们需要寻找一种适当的方法,自动识别复杂轨迹数据集中存在的模式,有效识别噪声,同时能够提供一种可视化的手段,使聚类结果易于分析。 在本文中,我们定义了两种新的轨迹间相似性度量,即离散化距离和时空Fréchet距离,并分别应用这两种距离提出了基于T-OPTICS的个体出行轨迹聚类方法。方法主要包括以下四个步骤:即轨迹间距离的计算、使用T-OPTICS方法进行轨迹的可达距离排序、通过阂值的设定确定最优算法参数以及聚类结果的可视化。针对方法的特点,本文分别采用栅格图和中位数图的形式直观的展现聚类结果。 在方法的验证上,本文通过模拟数据对方法的可用性与准确性进行了验证,并通过对北京市居民出行活动数据进行聚类分析,得出了远、中、近距离的白天出行、全天在家、短时间出行、多次外出、外出未归等多种出行模式,并对工作日与非工作日的出行模式进行了分析比较。我们进一步将方法的聚类结果与其他相关方法和一项相关研究的结果进行对比,证明了方法能够自动识别模式和噪声、聚类结果更为细致的优点。 本文的主要创新点包括:1、提出了新的轨迹间相似性度量:即离散化距离和时空Fréchet距离,并给出了具体的距离计算方法,为描述个体出行轨迹的模式提供了思路;2、分别针对距离定义的特点,给出了评价聚类结果的阈值,即最大聚类直径和Fréchet距离的时间阈值,并通过该阈值的设定,为选择聚类参数提供依据;3、提出了将聚类结果进行可视化的方法,将不同的轨迹聚类结果用对应的形式表现,直观的反映每个聚类代表的出行模式。