论文部分内容阅读
计算机技术的快速发展和GPS(Global Position System)设备的广泛应用,使记录车辆的轨迹信息变成了一项极其重要的工作。车辆的轨迹信息中蕴含着重要的商业价值,其中在已知轨迹的基础上,从海量GPS轨迹中挖掘出商业价值成为了研究的重点。但是当轨迹中存在缺失,分析结果的准确度就会下降。遗憾的是,大多数国家的智能交通系统都忍受着缺失数据的难题。例如:当车辆行驶在城市峡谷、人为的关闭GPS设备等原因,这都导致了缺失轨迹的存在。由于缺乏快速有效的补全缺失轨迹的算法,大部分缺失轨迹就被丢弃或者简单估计。这严重影响了后面轨迹的分析挖掘。本文以真实货车的行驶轨迹为研究基础,提出了轨迹补全的算法,为以后分析车辆的调度、驾驶员行为的分析、车辆的最佳行驶路线奠定了基础。数据清理阶段,本文在研究了轨迹方面的相关文献后,根据文章的需要,首先将给定的GPS原始数据(包括经度、纬度、速度等)根据要求化为标准的形式;然后挖掘出轨迹中包含的异常点,并将其去掉。在发现轨迹的断点方面,本文采用时间间隔和距离间隔的方法来发现轨迹中的缺失轨迹。首先根据GPS点中的经纬度信息来求出任意相邻两个GPS点之间的距离,然后根据相邻两个GPS点之间的时间,求出相邻两点之间的时间间隔。最后根据文中设定的阈值来找出轨迹中存在的断点。本文是在路网未知的情况下提出了两种不同的算法进行缺失轨迹的补全。第一种,首先找到缺失轨迹的起点和终点,根据同一企业不同车辆的历史轨迹信息找到所有的可行的道路。然后,计算出所有可能轨迹的时间和距离,最后根据K-modes聚类方法把所有可能轨迹分成不同的组,选择组内轨迹最多的一组的众数来补全缺失轨迹。第二种:在路网未知的情况下,轨迹的聚集情况能帮助我们了解道路的分布情况。所以本文提出了一种新STZ算法计算任意两条轨迹之间的面积,面积越小,轨迹越聚集,面积越大,轨迹越分散。然后定义了轨迹间距离的度量方法,即两条轨迹之间的面积、时间差和距离差三者的和。最后根据轨迹之间的距离,选择K-modes算法把轨迹分成不同的组,选择含有最多轨迹组的众数来补全缺失轨迹。在轨迹补全方面:在路网已知的情况下,本文首先将缺失轨迹的起点和终点映射到地图上,然后利用了A*算法来搜索可行路径中的最短路径,最后根据搜索结果补全缺失轨迹。