基于Spark的道路行程时间预测研究

来源 :长安大学 | 被引量 : 5次 | 上传用户:wdongjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着城市交通出行需求的快速增长,道路资源的供给逐渐成为交通运行的瓶颈,交通拥堵日益严重。道路行程时间是反映道路交通运行状态的重要参数,道路行程时间预测可以为交通管理措施制定和公众出行提供参考。为缓解快速增长的出行需求和有限的道路资源供给之间的矛盾,提高路网运行效率,本文以道路行程时间为研究对象,针对单机串行的海量轨迹挖掘效率低下的问题,利用Spark大数据处理平台,提出并行化的道路行程时间提取和道路行程时间预测方法,实现道路行程时间及时、准确地获取和预测,以便科学有效地制定交通管理措施,并为出行者的出行路线决策提供参考。由于单机的数据容量和数据处理能力有限、难以扩展,串行的轨迹数据挖掘效率低下,本文首先对大数据处理平台进行分析,基于HDFS的高可用、低成本、易扩展的特性和Spark的数据重用及并行化执行机制,从数据存储、数据处理、数据应用三个层面构建了大数据处理平台。其次,针对传统的道路行程时间预测方法不能有效地考虑道路行程时间的影响因素、不能充分挖掘道路行程时间序列内部关联的劣势,提出了基于长短期记忆网络(LSTM)的行程时间预测方法。本文选取了行程时间的主要随机性影响因素(降水类型、降水量、风速、气温、能见度)构造特征向量,优化选择LSTM网络参数,构建基于LSTM的道路行程时间预测模型。最后,以滴滴公布的网约车轨迹数据为实验数据,利用Spark大数据处理平台,采用数据并行化和任务并行化的策略,对海量轨迹数据进行了挖掘、分析,实现了行程时间预测的并行化方法。实验结果表明:本文构建的Spark大数据处理平台能够迅速、准确地从海量轨迹数据中提取出道路行程时间并进行道路行程时间预测。本文提出的行程时间预测模型的平均相对误差为0.071,显著优于ARIMA模型和随机森林模型;道路行程时间提取和预测的并行处理比串行处理效率明显提高,平台具有良好的可扩展性和加速比。本文提出的方法能对道路行程时间实现快速、准确地提取与预测,有助于解决道路拥堵问题,对实现高效、环保的城市交通环境具有一定的意义与价值。
其他文献
随着我国财政体制的改革,事业单位的财务预算管理逐步走向规范化和法制化,提高了事业单位财务管理水平。但其中也出现了一系列不可忽视的问题,直接关系到单位总体目标的实现
当前消费者对于保险服务品质的要求越来越高。针对保险中介在发展过程中存在的问题,本文对保险中介的价值进行了分析,提出了保险中介机构核心竞争力的培育与提升策略。
仙鹤草的临床与实验研究进展承德医学院苏佩清苏桂兰承德市中药厂王承华承德市药材站宁翠玲关键词仙鹤草,临床,实验仙鹤草为蔷薇科多年生草本植物龙芽草(AgrimoniapilosaLedeb)的全草。异名脱力草、马
<正>本刊讯(钟华报道)国家质量监督检验检疫总局和国家标准化管理委员会发布《快递封装用品》系列国家标准,将于今年9月1日起正式实施。此次内容修订与纸包装行业相关的主要
用木粉与高密度聚乙烯 (HDPE)复合制备了能代替木材的复合材料。考察了木粉含量、粒度、界面相容剂用量对复合材料力学性能、流动性的影响。结果表明 ,复合材料的弯曲强度随
众所周知,肿瘤组织和正常组织之间同时存在多种差异,为此各种不同刺激响应性的药物载体被研究出来。然而人体内环境复杂,单一刺激响应性的局限性逐渐暴露了出来,为了进一步提
本文对江苏省各地利用外资的情况进行了实证研究,认为江苏省的外资利用存在显著的南北地区差异。通过江苏省十三个地市利用外资的业绩与潜力指数的分析,指出了江苏省利用外资
我国为了鼓励企业加快技术改造步伐,降低投资风险,新会计准则允许部分固定资产使用快加速折旧法计提折旧费用。双倍余额递减法是加速折旧法的一种。本文首阐述双倍余额递减法
将多种增粘树脂溶解在丙烯酸单体中,预乳化后参与乳液聚合。并研究了其乳液聚合反应行为,讨论了乳化剂、引发剂、保护胶体、增粘树脂选择以及其最佳用量,确定了最佳反应条件,
近 10多年来 ,有限元方法被越来越多的应用于轮胎设计过程 ,进行参数化研究 ,从而减少轮胎发展周期 ,甚至可以替代一定的轮胎测试。文中轮胎的材料非线性、几何非线性及接触