基于Spark平台的短时交通流预测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:meyxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市汽车数量的急剧增加,城市的交通拥堵问题日益严重,严重影响了人们的日常生活。实时、准确的交通流预测可以为交通的管理和疏导提供依据,从而有效的解决城市的交通拥堵问题。交通流预测是通过对来自数据采集设备的交通流数据进行挖掘,找到交通流变化的内在规律,从而预测出各路段下一时刻的交通流状况。而随着数据采集技术的发展和数据采集设备的广泛应用,城市每天产生的交通数据量急剧增加,如何对海量的交通数据进行有效的处理、分析成为近年来的研究热点。传统的基于单台物理机的数据处理模式,由于受到内存、磁盘、CPU等因素的限制,无法满足对海量数据的存储和处理需求。为了解决单机环境在处理海量数据时处理能力的性能瓶颈,本文利用大数据计算框架在处理海量数据上的优势,提出了一种基于Spark分布式计算平台的短时交通流量预测方法,该方法在保证预测精度的基础上,有效的提高了算法的计算效率,增强了预测算法的实用性。本文的主要工作如下:1、利用交通流的时空特性,提出了一种基于时空关系的交通流特征向量生成方法,实验结果表明,基于时空关系的K近邻(KNN)预测模型的预测精度明显好于基于时间关系的KNN预测模型。2、针对单机环境下处理海量数据时存在的计算性能低、扩展性能差等问题,提出了在Spark平台上对传统KNN算法并行化实现的方法,该方法有效的解决了KNN算法近邻查找过程中搜索历史数据库效率过低的问题,提高了KNN算法的计算效率,改善了KNN算法的实用性。3、选取美国加州PeMS系统的实际交通流数据作为实验数据,以均方根误差、加速比等作为评价指标,在由多个节点组成的分布式集群中对交通流量进行预测仿真,并对算法的预测精度和预测时间进行比较。实验结果表明,基于Spark平台的短时交通流预测,可以在保证预测精度的前提下,满足对海量交通数据的实时处理要求,并且系统具有良好的扩展性和加速比。
其他文献
<正>大企业想要高效运行并保持基业长青,需要良好的组织运行逻辑,从组织理念、事业格局、商业模式、竞争策略、企业领导、组织建立及机制建设等方面,均需要明确方向及界限,以
随着汽车工业的快速发展,日益增加的全球汽车保有量,使得对能源的需求及消耗量也日益增大,而世界石油资源紧缺,同时由汽车产业带来的环境污染问题也日益严重,寻找并使用清洁代用燃
偏高岭土,因具有火山灰效应、碱激发效应和填充效应,一直被认为是一种优质的混凝土掺合料,但是偏高岭土比表面积巨大,具有很高的活性,因此很容易发生团聚。本文正是从此点着
检察权是建构运行机制的逻辑前提,检察权运行机制功能的正常发挥,又能够验证检察权的配置是否合理,并能为检察权的优化配置提供依据和进路。而从检察权运行机制顺畅运转对检
我国劳动争议处理制度自1987年恢复以来,就实行“一裁两审、仲裁前置”的劳动争议裁审模式,该模式在其确立之初及之后的一段时间,为解决劳动争议发挥了很大的作用。随着我国
“小金库”的存在在国有企业是一个比较普遍的现象,它在为企业领导人带来某种所谓的方便之际,也滋生了腐败的根源,成为许多国企高层身陷囹圄的陷阱。笔者认为,开展“小金库”治理
近年来,因氟乙酰胺致中毒的病例呈上升之势,临床致死原因中循环衰竭占第二位.本文从氟乙酰胺对心率、心律、心肌供血不足、心肌酶和心肌形态学影响诸方面综述了氟乙酰胺对心
随着新音乐课程改革的不断深入,音乐教师的能力和素质在改革中所起到的作用也越来越大。新音乐课程改革以促进学生发展为中心的教学理念对教师提出了更高的要求,教师在整个教
本文按照选煤厂工业场地平整设计要求,分析工程设计的实际案例,提出在地形地貌条件不同的情况下,对于选煤厂场地平整的优化设计需要考虑的因素,以使选煤厂工业场地总体布局更
青藏高原东北部地区对全球变化异常敏感,系统研究该区地面风时空分布特征对理解青藏高原乃至北半球的大气环流演变具有重要意义.本文通过分析青藏高原东北部20个气象台站1982~20