具有长期依赖的出租车轨迹目的地预测

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:li81641143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息和通信技术以及全球定位系统(Global Positioning System,GPS)的迅猛发展,车辆、人、动物等移动对象在运动过程中产生的轨迹数据呈爆炸式增长趋势,基于位置服务(Location Based Services,LBS)的广泛应用使得轨迹预测的需求日益增加,轨迹预测已经成为当前的研究热点。出租车已经成为人们日常出行的首选,出租车的轨迹预测更能体现人们的日常活动。本文以出租车轨迹目的地预测为研究问题,围绕出租车轨迹目的地预测方法展开研究,主要研究内容如下:(1)基于SDZ-RNN的长期依赖出租车轨迹目的地预测轨迹目的地预测时,轨迹数据存在“长期依赖”问题,影响预测的准确率。传统的马尔科夫预测方法仅仅依赖于目的地前2到3个GPS点,不适用具有很长依赖关系的轨迹。当预测目的地依赖的GPS点的数量增加,轨迹预测的相关点离输出时刻太远时产生长期依赖,采用循环神经网络(Recurrent Neural Network,RNN)的多个隐藏层存储这种依赖关系,从而解决长期依赖对预测准确率的影响。但是随着依赖关系的进一步增长和层的深入,RNN的隐藏层对较小的扰动变得十分敏感,较小的扰动会导致RNN中间状态中的错误成分被指数级放大,特别是在反向传播更新参数时,小小的变化就会导致参数呈指数级缩小或者增大,产生梯度消失或者梯度爆炸问题,无法学习轨迹之间的依赖关系出现“记忆丢失”,导致预测准确率降低。为了解决轨迹目的地预测中的长期依赖问题,提高预测准确率,将正则化方法SDZ(Surprisal-Driven Zoneout)应用到RNN中,提出一种基于SDZ-RNN的长期依赖出租车轨迹目的地预测方法(Prediction taxi Destination with Long-term dependencies by regularized RNN with SDZ,PDLRS)。首先,SDZ概率性保留RNN中的某些输出神经元,与舍弃神经元对应的参数也被舍弃,减少了RNN中参数的数量,提高泛化能力。其次,SDZ采用反馈环对保留下来神经元的输出进行计算,进而在更新参数时将梯度控制在一定范围内,有效避免了梯度消失和梯度爆炸问题,避免出现“记忆丢失”,解决了轨迹目的地预测中的长期依赖问题,提高了RNN的鲁棒性。特别的,当反馈比率为零使得前后单元状态一致时,参数不会更新,减少了参数更新的次数。参数数量和更新次数的减少节省了训练时间。采用波尔图出租车轨迹数据集进行实验,实验表明,PDLRS在精度和速度上都优于普通的RNN预测方法,最佳预测准确率提高了12%,训练完成时间降低了7%。(2)长期依赖出租车轨迹目的地快速预测采用RNN进行轨迹目的地预测时,当前时刻隐藏状态和记忆单元状态的计算都依赖于前一时刻的隐藏状态,这种状态计算的顺序依赖关系需耗费大量时间和硬件资源,进而影响预测准确率。为了加快训练和预测速度,同时保持模型解决长期依赖的能力,提出一种长期依赖出租车轨迹目的地快速预测方法(Fast resolution of taxi Destination Prediction with Long-term dependencies,FDPL)。一方面,FDPL使用简单循环单元(Simple Recurrent Unit,SRU)替换普通的RNN单元来加快训练和预测速度,因为SRU消除了当前状态(记忆单元状态和隐藏层状态)计算时对前一时刻隐藏层状态的依赖,同时当前记忆单元状态和隐藏层状态的计算采用简单的逐点相乘替代复杂的矩阵相乘,提高训练的效率;另一方面,正则化方法SDZ减少了参数的数量和更新次数,节省训练时间,同时可以避免“记忆丢失”,解决长期依赖。SRU和SDZ的结合可以快速解决长期依赖,从而实现长期依赖的轨迹目的地快速预测。采用波尔图出租车轨迹数据集进行实验,实验表明,FDPL的训练时间是普通的RNN和长短记忆性神经网络(Long Short Term Memory Network,LSTM)预测方法的1/4。(3)基于频域处理的多特征融合出租车轨迹目的地预测简单采用神经网络进行预测的方法将GPS点作为空间点序列按顺序输入到人工神经网络中,忽略了轨迹数据之间的时空联系。随后出现了将轨迹数据转化为二维的轨迹图像,通过轨迹图像来表示轨迹数据之间的时空联系,但是因为轨迹本身的稀疏性和复杂性使得转化后的轨迹图像是稀疏的并且含有噪音。由于图像的频域可以表示图像的变化程度,去除图像的噪点,轨迹图像的不同频域表示可以显现出轨迹图像的不同特征,所以将频域处理应用到轨迹图像中,降噪的同时通过丰富特征来缓解数据稀疏,提出一种基于频域处理的多特征融合的出租车轨迹目的地预测算法(Multi-features Taxi Destination Prediction with Frequency Domain Processing,MTDP-FD)。首先,MTDP-FD利用快速傅里叶变换和其逆变换将空域轨迹图像转换为轨迹图像的频域表示,降噪的同时凸显特征。其次,因卷积神经网络(Convolutional Neural Network,CNN)对图像有显著的学习能力,所以利用CNN从轨迹图像的频域表示中提取深度特征,实现降维。然后,采用RNN进行轨迹目的地预测,轨迹图像的深度特征与轨迹数据,轨迹元数据进行组合作为RNN的输入,特征组合有效缓解数据稀疏。采用波尔图出租车轨迹数据集进行实验,实验表明,MTDP-FD的平均距离误差比现有方法降低了0.14km,并得到了最佳的特征组合方式。
其他文献
北斗卫星导航系统(Bei Dou Navigation System,BDS)是我国自主发展、独立运行的全球卫星导航系统,服务范围已覆盖亚太地区。截止到2016年6月,在轨工作的北斗卫星共有20颗。根
为了满足未来聚变堆用CICC导体的测试需要,中国科学院强磁场科学中心正在研制一套大型的CICC导体测试系统。80k A超导变压器作为导体样品的电流源,是测试系统的关键部件。其
财务外包作为一种新兴业务,能够在节省成本、节省人力的基础上,给予中小企业专业的财务技术支持。本文围绕我国中小企业在进行财务外包业务的过程中出现的信息泄露、企业人才
在电力系统之中,最常见的设备莫过于变压器了,对于整个电网系统来说,不论是用电方面或是发电方面还是供电方面,其变压器都起着至关紧要的作用,对变压器进行高压实验,不仅仅可
氧化剂的热分解性能直接决定了固体推进剂的推力和比冲等性能。ZnO具有催化活性高、稳定性好等特点,可改善氧化剂的放热量和分解温度,进而提高推进剂的能量性能,因而开发高性
长期以来煤炭产业一直是我国社会和国民经济发展的重要物质基础,由于多年连续开采,浅层煤炭已经枯竭,只能进行地下开采,而地下开采过程中多伴随着涌出甲烷气体、CO气体和粉尘等危险源,严重威胁着煤矿财产安全和人民生命安全。因此,建立一套先进可靠的安全监测系统显得尤为重要。目前,我国煤矿安全监测数据采集系统主要存在的问题有:大多数传感器采用催化和电化学技术,寿命较短,稳定性较差,且传感器通信接口单一,系统扩
二十四节气是天文历算中的历算部分.藏族历算文化历史悠久,内容丰富,在漫长的发展过程中,形成了较完整的理论体系.文章就藏汉二十四节气的关系、各自的特点及其二十四节气的
<正>2016年11月30日当地时间12点30分,在埃塞俄比亚首都亚的斯亚贝巴联合国非洲经济委员会会议中心举行的联合国教科文组织保护非物质文化遗产政府间委员会第十一届常会上,中
革兰氏阴性菌是慢性根尖周炎的常检出菌,可导致细胞死亡和促炎因子释放。目的:研究不同细菌通过caspase-1及其介导的焦亡、促炎因子释放在根尖周炎的作用。方法:人健康牙周膜
据统计,2001年全球跨国投资逾1万亿美元,其中跨境并购占80%以上。跨境并购在我国还处于起步阶段,但巨大的潜在市场和良好的发展前景吸引着许多跨国公司欲来华一展身手。