论文部分内容阅读
随着智能手机和GPS导航仪的普及,海量记录位置信息的数据被不断产生,对这些位置数据进行实时分析和充分利用的需求日益迫切。轨迹数据作为最常见的位置数据,是智能交通系统(Intelligent Transportation System,ITS)中研究的重点方向。本文将研究移动轨迹的预测模型,该领域是近几年智慧城市与智能交通的研究热点之一,主要是因为对移动对象的轨迹进行实时的预测可以有效地防止交通拥堵,同时能够为用户提供更加个性化的基于位置的服务。目前已存在多种轨迹预测问题的解决方法,包括基于统计的方法和基于深度学习的方法。但是现有的方法缺少统一的评测环境,因此很难对不同算法的性能进行客观比较。其次,许多算法借助额外的数据来提高预测精度,而这些外部数据往往难以获得,这就导致评价这些算法时缺少公平的实验设定和评价标准。针对这些问题,本文对多种主流的预测算法在相同的数据集、硬件环境、实验设定和评价标准的情况下进行全面的评估。我们选取5个基于统计的算法和10个基于深度学习的算法,给定的评估设定是利用一个移动对象过去30个时间戳的原始轨迹数据,对未来不同长度时间的轨迹进行预测,使用平均绝对误差和命中率来对预测效果进行统一的评估。我们利用三个具有不同运动模式的真实轨迹数据集对上述15种算法进行广泛的实证评估,并根据实验结果揭示有趣的发现和规律。在评估各个轨迹预测算法的过程中,我们发现两个问题,一个是在真实的轨迹数据集中,存在大量符合真实运动模式的静止轨迹,现有的预测方法在处理这种输入数据时,通常都会输出一条运动的轨迹,这会导致预测的误差很大。第二个问题是,由于轨迹点都是由二维经纬度组成,许多数据之间的差异非常微小,直接使用单个模型无法很好的对数据建模。针对第一个问题,本文提出一个移动状态预测组件,在预测轨迹之前先对其运动状态进行预测,该组件能够有效地提高预测精度。针对第二个问题,我们借助多层感知机和长短期记忆网络来解决,利用多层感知机来捕获轨迹数据中的局部特征,利用长短期记忆网络来捕获轨迹数据中的时间特征。我们将移动预测组件组合到多层感知机和长短期记忆网络中,得到一个新的基于随机森林和MLP-LSTM的轨迹预测混合模型。本文在三个真实的数据集中对我们提出的混合模型进行验证,实验结果表明,本文提出的混合模型优于现有的对比方法。