论文部分内容阅读
城市公共交通大数据蕴含着丰富的时空信息,是进行乘客出行特征分析、城市交通服务能力评价以及公共客流预测的数据基础,是城市公共交通科学管理和规划设计的重要依据。随着城市交通的快速发展,城市管理部门积累了体量超大的交通数据,然而这些数据并不能得到充分利用,因为传统的交通数据分析软件无法对大数据进行加载、处理和分析,所以一般采用从大数据中抽取数据的方法,样本量较小,并且分析结果大多以二维图表为主,数据可视化效果一般。为此,本文以北京市公交车刷卡数据和出租车GPS轨迹数据为研究对象,主要进行了以下几个方面的研究工作:(1)搭建Hadoop分布式计算平台。利用实验室八台电脑搭建微型分布式集群,将30天公交车刷卡数据和7天出租车GPS轨迹数据进行分布式存储,并利用MapReduce编程模型进行数据清洗、预处理和数据挖掘。(2)构建公交车乘客出行链和交通工具客流模型。研究建立基于时空约束的公交车乘客出行链、基于公交站点的公交车客流模型和基于车辆状态的出租车客流模型。基于上述模型完成公交车换乘数据、公交车客流数据、出租车客流数据的提取和计算。(3)城市公共交通大数据时空分析。根据不同种类交通工具的运营特性和乘客出行特点,设计并实现了包含公交线路运营分析、交通枢纽客流分析和识别乘客职住地在内的多种城市公共交通大数据分析方法,并从出行时间、出行热点和出行时长三个方面进行了不同种类交通工具乘客出行特征的差异性分析。(4)基于WebGIS的数据可视化。为充分展示交通大数据的时空特性,通过整合在线地图服务、二维空间数据和三维模型数据,并采用热力图、三维柱状图、交互式地图和非空间地理图表等多种表达方式进行交通大数据分析计算结果的可视化。(5)在技术上整合WebGIS和Hadoop分布式计算平台。充分利用WebGIS丰富的表达手段和Hadoop分布式存储计算的优势,实现从客户端发布数据请求、Hadoop集群分布式计算到利用WebGIS进行数据可视化的闭环流程作业。本文通过搭建Hadoop分布式计算平台进行交通大数据挖掘,为全方位、多角度的对城市公共交通大数据进行分析计算打下坚实的基础,并建立基于WebGIS的可视化系统进行数据计算结果的可视化分析,为人们带来更加直观的视觉体验,有利于发现可视化隐含的规律,并将WebGIS架构与Hadoop进行整合,减少人工中途干预,从而解决了大数据集中调用显示的难题。