论文部分内容阅读
城市公交是重要的公众出行方式,对公交大数据进行整合分析有助于智能交通的建设,如何对城市公交大数据进行有效的管理分析仍然是一个研究难题。城市公交大数据是包含空间信息的异构数据,将大数据理论与地理信息系统相结合也是当前研究的热点。地理可视化通过视觉交互有效地解释公交大数据,而现代WebGIS构建的在线虚拟地理空间是最受欢迎的地理可视化载体。本文设计并实现了城市公交大数据处理分析方法,以北京市为例,整合了公交空间数据与刷卡数据,构建了公交数据模型,利用多种地理可视化方法对数据进行分析。本文主要研究内容有:(1)在WebGIS中集成Hadoop大数据框架。利用Hadoop的分布式文件系统(HDFS)来存储管理公交大数据,将其作为WebGIS的数据仓库。通过MapReduce编程模式对数据进行统计分析,从而实现WebGIS后台数据驱动。(2)公交大数据预处理。先对数据进行清洗,通过异常检测和一致性分析探测出公交刷卡数据中无效的数据,通过调研等方式验证无效数据的合理性并将其剔除。公交大数据具有异构性,通过数据关联确定公交刷卡数据、公交线路站点数据和行政区划数据之间的联系。(3)公交模型构建。研究了公交乘客出行模式并将其细化,采用公交乘客HomeWork出行模式进行分析,根据乘客刷卡时空有序性,从时间维度和空间维度对乘客刷卡记录进行换乘分析,构建出乘客的公交出行链模型。以公交车辆为分析对象来构建公交客流模型,将公交刷卡记录归并到公交车辆每个途径站点之上,推算出公交车辆乘客数量的变化,根据刷卡记录中的时间信息确定公交车辆到站时间与出站时间,乘客量与时间信息便构成时空客流数据。(4)提出一种根据空间散点拟合空间曲面的方法。参照计算机屏幕像素的排列,将屏幕像素反投影至虚拟地理空间,并将其视作网格顶点与数据点关联分析,平滑后便得到地理空间网格曲面。这种方法简化了空间曲面拟合中插值计算和曲面细化过程,可以高效构建空间曲面。(5)公交大数据地理可视化分析。在地理空间中对公交大数据进行可视化,地理可视化包括平面可视化、三维可视化、动态可视化和交互式可视化表达等多种方式。利用不同的可视化方法对公交大数据进行多角度分析,构建公交乘客画像来分析北京市公交乘客空间分布及活动区域;区域OD图反映了公交乘客区域出行情况;公交客流可视化展示了公交客流时空特征。