论文部分内容阅读
随着城市交通问题的越来越突出,发展和提升公共交通成为了解决交通问题的有效策略之一。而ICT(Information Communications Technology)技术的发展,产生了大量公交车GPS轨迹和公交IC卡刷卡数据,激发了许多基于这类数据的公交规划和居民交通出行等方面的研究。但是由于硬件的限制和软件系统的问题,公交车GPS轨迹数据在采集的时候往往会出现数据丢失,数据字段不正确等问题;如果不对这些不完整的数据进行恢复,则利用这些数据得出来的研究结果会与实际情况相差较大。因此本课题针对如何有效还原缺失的公交车GPS轨迹进行研究。本文通过分析深圳市大量的公交车GPS数据以及对应公交IC卡刷卡数据,发现约三分之一的IC卡刷卡数据没有对应的公交车GPS数据,这将导致后续利用这些数据来进行其他方面的研究难以展开。论文首先对各类多源公共交通数据进行预处理,将原本相对独立的公交GPS轨迹数据、公交站点数据和用户公交IC卡数据进行关联匹配;然后基于用户通勤模式(家与工作地的往返模式)和换乘模式(有轨迹数据的车辆与无轨迹车辆间的换乘,反之亦然)中存在的时空规律性,对缺失数据进行时空约束从而达到还原的目的。由于通勤模式和换乘模式中在空间和时间上仍然存在着不确定性,论文引入模糊集理论对公交IC卡用户的出行模式进行建模,分析了隶属函数和隶属度的确定方法。最后,利用该模糊集模型对公交车GPS轨迹进行还原,并应用K-means算法来对还原后的数据进行聚类分析得出公交车到站信息。交叉验证的结果证明,利用本文提出的模型和方法,可以把IC卡数据的可用率从60%左右提升到了80%左右,大大提高了数据质量,表明基于IC卡用户的出行模式可以有效地还原缺失的公交车轨迹。在数据还原的基础上,论文利用还原后的数据进行了公交出行OD分析及换乘模式分析。本研究不仅对提高公交数据的质量有一定贡献,可辅助后续的数据分析和挖掘,还对具有时空不确定性的公交出行模式的进行了模糊集表达,为相关研究提供了模型基础。