论文部分内容阅读
随着近年来定位技术的快速发展和便携式定位设备的广泛应用,人们收集了大量轨迹数据。在这些轨迹数据中包含着大量的潜在信息。这些信息对人类科研和生活都有着重要价值。轨迹数据挖掘日益受到人们关注。轨迹分割和轨迹聚类在轨迹数据挖掘领域有诸多应用。轨迹分割能有效简化轨迹,降低轨迹数据处理维度,凸显局部信息。而轨迹聚类能发现隐含于轨迹数据中的共同规律,是挖掘轨迹信息的一种有效手段。 运动对象的个体规律和群体规律是人们所关注的两个热点。轨迹数据挖掘能有效提取出轨迹数据中所蕴含的规律信息,在这之中,轨迹分割和轨迹聚类是两种十分有效的方法。轨迹分割能简化轨迹数据和凸显局部信息,子轨迹聚类能进一步提取蕴含于轨迹数据中的规律信息。在经典的轨迹分割和子轨迹聚类算法中,都存在着不足。本文从这两个经典算法的不足出发,在调研相关方法后,提出了新的轨迹分割和子轨迹聚类算法。 论文的主要工作如下: 1、该文针对现有的基于最小描述长度(MDL)的轨迹分割算法的不足,提出了基于平行夹边的轨迹分割算法。在基于MDL的轨迹分割算法中,当轨迹点偏离中心线两侧较远时,算法无法找到局部最优解。其次,该算法还存在计算量大的缺点。本文提出了一个以平行夹边为基础的轨迹分割方法,新算法基于轨迹外形对轨迹进行分割。该方法在分割轨迹时,通过平行夹边限制轨迹点的分布,改善了基于MDL分割算法中无法找到局部最优解的问题。同时,该方法仅需要计算轨迹点是否在平行夹边内,计算量较小。 2、该文针对现有的以DBSCAN为基础的子轨迹聚类方法的不足,提出了基于密度峰值的子轨迹聚类算法。以DBSCAN为基础的子轨迹聚类算法通过邻域参数来确定核心子轨迹进而实现子轨迹聚类。该算法对邻域参数十分敏感。本文构建了基于密度峰值的子轨迹聚类算法。在新的轨迹聚类算法中,其核心思想是子轨迹的聚类中心具有较高局部密度,且聚类中心之间存在较远距离。新算法聚类时仅依赖数据本身属性,其对输入参数鲁棒。实验结果显示,基于密度峰值的子轨迹聚类算法具有更好的聚类效果。