论文部分内容阅读
随着机动车辆的迅猛增长,特大城市的交通问题日趋严重,城市路网中事件多发、通行状态多变。能够快速、准确的对大城市路网中的交通状态识别和分析有着极为重要的意义。与此同时,随着大数据技术的飞速发展,海量轨迹数据的采集、传输、分析的技术逐步成熟,这也就使得我们能够通过对道路中海量浮动车的轨迹数据进行挖掘,及时发现路网中出现的问题,进一步提高路网的运行效率,也能够帮助路网中的参与者更高效、更安全的完成出行。在应用浮动车轨迹提取道路网中的交通参数的传统方法中,需要将轨迹数据与地理信息系统中的道路网络的矢量数据进行匹配,即通过匹配在道路上的车辆的位置和速度来完成路段交通运行参数的计算,因此在计算过程中,浮动车轨迹数据与GIS矢量地图缺一不可。而实际情况中存在GIS地图更新不及时和轨迹匹配计算量大两方面问题,因此此次研究提出一种方法,不以道路矢量地图为基础,仅通过浮动车轨迹数据实现城市交通运行状态判别、拥堵识别以及行程时间预测。即将研究区域划分为均匀网格,通过对海量浮动车轨迹数据进行处理提取网格的交通特征,将网格作为研究一定区域内交通问题的载体。因此本论文首先对浮动车轨迹数据进行预处理,然后构建网格模型对区域宏观交通运行状态进行判别;在此基础上,进一步深化网格模型,通过浮动车经过网格边界的轨迹数据,提取了网格的静态特征和动态特征,并以网格的特征数据针对拥堵识别和行程时间预测进行了深入研究,最终本论文的主要研究内容为以下五个方面。(1)通过对海量浮动车原始数据进行描述性分析,对原始浮动车轨迹中存在的质量问题归纳总结,建立了浮动车轨迹数据的预处理流程,并按照流程对2012年11月北京市浮动车的海量数据进行了校准和清洗,清洗结果能够较好的满足后续的研究需求。(2)构建网格模型,将浮动车轨迹数据与划分为网格的研究区域进行匹配,提取网格交通运行指数,通过数据挖掘,对网格模型下的城市交通运行状态判别方法进行了研究,通过对网格进行密度聚类,按照聚类结果,将大城市拥堵区域的类型从空间范围上划分为“点——线——面”三个层级。(3)完善网格模型,对经过网格的轨迹数据进行解析、统计、聚类处理,提取轨迹经过网格的进出位置节点以及连通进出点组成的节点构成网格静态特征,提取轨迹从进入网格到离开网格的转移花费时间构成网格的动态特征,进一步将时间维度引入模型,统计分析网格内行程时间的时序变化数据,根据网格内节点对行程时间的历史数据,识别常发拥堵的节点对;结合实时行程时间数据,识别偶发拥堵事件。(4)深化网格模型,提出网格模型行程时间预测方法,以网格内历史行程时间和实时行程时间两类数据相结合作为准备数据,将多元线性回归和KNN非参数回归结合作为预测方法,对网格内节点对行程时间进行预测。通过对海量浮动车轨迹数据进行挖掘,提取两网格之间的多条轨迹,对网格模型节点对形式下的轨迹进行统计处理,提取出其中的有效路径,将路径提取方法和节点对行程时间预测方法相结合,给出针对给定OD两点,进行行程时间预测的方法。(5)应用网格模型,结合.NETFramework技术和ArcgisEngine技术,建立了基于浮动车轨迹数据的行程时间预测系统,系统针对研究区域,依照网格模型的构建方法,生成区域内网格化地图,结合导入的浮动车的轨迹数据,实现历史数据下的常、偶发拥堵的识别以及实时数据流下的偶发拥堵事件识别功能;实现网格模型下OD之间的路径提取以及当前交通状态下的路径行程时间预测功能;最终针对上述功能,应用Arcgis Engine的二次开发组件和动态链接库,实现可视化展示。