论文部分内容阅读
随着智能公交的快速发展,我国城市公交迈入了信息化时代,公交智能调度、电子收费等智能系统的推广应用,使得海量的公交运行基础数据可实现自动化采集,能够为公交运营企业和行业管理部门了解现状、发现问题、制定决策提供可靠的数据保障,既降低了人工调查成本,也提高了准确性和效率。毫无疑问,基于公交智能化基础数据的分析应用,将给未来我国公交精细化运营管理的发展创造极大的便利。尽管前景光明,但是,在目前的发展阶段还存在一些问题:1)公交运行信息采集的不完整,给公交数据挖掘分析带来了很大的难度,如公交IC卡数据缺少部分乘客出行的关键字段,大大降低了数据的实用性;2)单源数据存在局限性,多源公交数据的综合利用还有待发展。由于单源数据存在缺陷,处理分析精度相对较低。而多源公交智能化数据能够提供更全面的信息,因此,实现多源公交数据的融合处理,对于公交行业数据挖掘工作是十分必要的;3)基于公交数据的支撑应用有待改善。在海量数据支持下,决策制定的合理性与科学性得到保证,但决策前端需求以及分析架构仍需要进一步梳理,才能达到理想的效果。 在这种背景下,本文根据公交IC卡数据、GPS数据、AFC数据的结构特点,结合公交运行和乘客出行的规律特征,提出了在不同数据源支撑条件下的公交运行相关信息的获取方法,使公交IC卡数据能够为交通分析所用。 在公交IC卡数据信息提取中,基础信息包括公交班次、站点客流量以及车辆运行(客流)方向三类信息。本文引入数据挖掘中的聚类分析方法,根据公交单车辆运营班次、站点上车客流在时间维度中具有与团聚性的特点,利用k-means聚类方法实现对公交单车辆运营班次和站点客流量信息的获取,并根据班次数(站点数)对初始聚类个数与聚类终止条件进行了约束。其次,根据单条公交线路方向性客流差异的规律性,引入时间序列的相似性测量方法,用于公交车辆运行(客流)方向信息的获取。该方法基于单源公交IC卡数据,通过测量单班次线路站点客流量与经验数据的相似性来识别方向信息,数据实验表明当线路客流存在方向性差异时,该方法能够准确识别车辆运营(客流)方向。 为了获取公交出行站点位置信息,建立了基于不同数据源的信息获取方法。包括1)基于特征站点的公交IC卡数据站点匹配方法,根据前提条件寻找线路特征站点(客流峰值站点与换乘站点),并对特征站点优先进行匹配,从而提高匹配精度;2)基于GPS与公交IC卡数据的乘客上车站点匹配方法,通过初次匹配获取GPS系统与IC卡系统的时间偏差,根据系统时间偏差,利用二源数据的时间标签将GPS数据的位置信息与IC卡交易记录进行匹配,获得乘客上车站点位置信息。3)基于换乘分析的乘客下车站点识别方法,利用多源数据,通过对公交站点间距和相邻交易时间差值来识别换乘行为,从而获取乘客下车站点信息。数据实验表明,上述方法均能够满足数据处理与分析的精度要求。 在公交信息获取方法研究的基础上,进一步深入分析了城市公交系统参与者在公交系统中的角色与相应需求,以需求为导向,建立在多源数据支撑条件下的公交系统运行评价指标体系,并基于指标相关性分析及指标可行性进行指标选取,提出了指标评价等级划分方案与多源数据条件下的指标生成方法。以北京市东城区、朝阳区公交系统为评价对象,设计分析案例,利用效用函数综合评价方法验证评价指标体系的可行性。