论文部分内容阅读
随着信息和通信技术以及全球定位系统(Global Positioning System,GPS)的迅猛发展,车辆、人、动物等移动对象在运动过程中产生的轨迹数据呈爆炸式增长趋势,基于位置服务(Location Based Services,LBS)的广泛应用使得轨迹预测的需求日益增加,轨迹预测已经成为当前的研究热点。出租车已经成为人们日常出行的首选,出租车的轨迹预测更能体现人们的日常活动。本文以出租车轨迹目的地预测为研究问题,围绕出租车轨迹目的地预测方法展开研究,主要研究内容如下:(1)基于SDZ-RNN的长期依赖出租车轨迹目的地预测轨迹目的地预测时,轨迹数据存在“长期依赖”问题,影响预测的准确率。传统的马尔科夫预测方法仅仅依赖于目的地前2到3个GPS点,不适用具有很长依赖关系的轨迹。当预测目的地依赖的GPS点的数量增加,轨迹预测的相关点离输出时刻太远时产生长期依赖,采用循环神经网络(Recurrent Neural Network,RNN)的多个隐藏层存储这种依赖关系,从而解决长期依赖对预测准确率的影响。但是随着依赖关系的进一步增长和层的深入,RNN的隐藏层对较小的扰动变得十分敏感,较小的扰动会导致RNN中间状态中的错误成分被指数级放大,特别是在反向传播更新参数时,小小的变化就会导致参数呈指数级缩小或者增大,产生梯度消失或者梯度爆炸问题,无法学习轨迹之间的依赖关系出现“记忆丢失”,导致预测准确率降低。为了解决轨迹目的地预测中的长期依赖问题,提高预测准确率,将正则化方法SDZ(Surprisal-Driven Zoneout)应用到RNN中,提出一种基于SDZ-RNN的长期依赖出租车轨迹目的地预测方法(Prediction taxi Destination with Long-term dependencies by regularized RNN with SDZ,PDLRS)。首先,SDZ概率性保留RNN中的某些输出神经元,与舍弃神经元对应的参数也被舍弃,减少了RNN中参数的数量,提高泛化能力。其次,SDZ采用反馈环对保留下来神经元的输出进行计算,进而在更新参数时将梯度控制在一定范围内,有效避免了梯度消失和梯度爆炸问题,避免出现“记忆丢失”,解决了轨迹目的地预测中的长期依赖问题,提高了RNN的鲁棒性。特别的,当反馈比率为零使得前后单元状态一致时,参数不会更新,减少了参数更新的次数。参数数量和更新次数的减少节省了训练时间。采用波尔图出租车轨迹数据集进行实验,实验表明,PDLRS在精度和速度上都优于普通的RNN预测方法,最佳预测准确率提高了12%,训练完成时间降低了7%。(2)长期依赖出租车轨迹目的地快速预测采用RNN进行轨迹目的地预测时,当前时刻隐藏状态和记忆单元状态的计算都依赖于前一时刻的隐藏状态,这种状态计算的顺序依赖关系需耗费大量时间和硬件资源,进而影响预测准确率。为了加快训练和预测速度,同时保持模型解决长期依赖的能力,提出一种长期依赖出租车轨迹目的地快速预测方法(Fast resolution of taxi Destination Prediction with Long-term dependencies,FDPL)。一方面,FDPL使用简单循环单元(Simple Recurrent Unit,SRU)替换普通的RNN单元来加快训练和预测速度,因为SRU消除了当前状态(记忆单元状态和隐藏层状态)计算时对前一时刻隐藏层状态的依赖,同时当前记忆单元状态和隐藏层状态的计算采用简单的逐点相乘替代复杂的矩阵相乘,提高训练的效率;另一方面,正则化方法SDZ减少了参数的数量和更新次数,节省训练时间,同时可以避免“记忆丢失”,解决长期依赖。SRU和SDZ的结合可以快速解决长期依赖,从而实现长期依赖的轨迹目的地快速预测。采用波尔图出租车轨迹数据集进行实验,实验表明,FDPL的训练时间是普通的RNN和长短记忆性神经网络(Long Short Term Memory Network,LSTM)预测方法的1/4。(3)基于频域处理的多特征融合出租车轨迹目的地预测简单采用神经网络进行预测的方法将GPS点作为空间点序列按顺序输入到人工神经网络中,忽略了轨迹数据之间的时空联系。随后出现了将轨迹数据转化为二维的轨迹图像,通过轨迹图像来表示轨迹数据之间的时空联系,但是因为轨迹本身的稀疏性和复杂性使得转化后的轨迹图像是稀疏的并且含有噪音。由于图像的频域可以表示图像的变化程度,去除图像的噪点,轨迹图像的不同频域表示可以显现出轨迹图像的不同特征,所以将频域处理应用到轨迹图像中,降噪的同时通过丰富特征来缓解数据稀疏,提出一种基于频域处理的多特征融合的出租车轨迹目的地预测算法(Multi-features Taxi Destination Prediction with Frequency Domain Processing,MTDP-FD)。首先,MTDP-FD利用快速傅里叶变换和其逆变换将空域轨迹图像转换为轨迹图像的频域表示,降噪的同时凸显特征。其次,因卷积神经网络(Convolutional Neural Network,CNN)对图像有显著的学习能力,所以利用CNN从轨迹图像的频域表示中提取深度特征,实现降维。然后,采用RNN进行轨迹目的地预测,轨迹图像的深度特征与轨迹数据,轨迹元数据进行组合作为RNN的输入,特征组合有效缓解数据稀疏。采用波尔图出租车轨迹数据集进行实验,实验表明,MTDP-FD的平均距离误差比现有方法降低了0.14km,并得到了最佳的特征组合方式。