论文部分内容阅读
在城市交通运行过程中,车辆的GPS设备、自动收费系统、出行者手机等设备采集了大量的人类、车辆轨迹数据,可用于挖掘城市人群活动规律,理解城市职住空间分布、居民通勤行为。另一方面,时间序列分析技术在语音、文字识别等多领域广泛应用,其在时空大数据分析中亦可用来发掘数据中隐含的规律。本文应用时间序列及相关分析技术挖掘共享交通订单大数据和移动社交网络中隐含的城市空间规律信息。本文主要进行了以下三个方面的研究:(1)研究了交通出行订单数据和移动互联网签到数据的时空离散化方法。采用Lambert等面积格网将带时间戳的空间散点数据在空间上离散化、分段化,采用时间窗口分段方法将数据在时间上离散化,将信息密度较低的共享单车订单、签到散点数据集,转化成了网格区域出行需求时间序列数据集和移动互联网签到热度数据集。(2)应用时间序列分析方法对时间序列化后的网格区域出行需求数据集进行分析,寻找典型的出行需求模式。利用动态时间规整(DTW)算法度量格元出行需求时间序列的相似性,利用无监督密度聚类算法DBSCAN基于DTW距离度量对格元出行需求进行聚类,发现了早晚高峰出入需求平衡、早晚高峰分别有净流入/流出但全天平衡,以及2种全天出入不平衡共5种典型的共享单车需求模式。本研究一方面可由出行需求序列峰值正负规律揭示北京市典型的通勤区域,另一方面可为共享单车运营调度、平衡车辆需求和供给提供策略参考。此外研究了基于出行订单数据描述和评价出行者出行规律性的方法,提取时间、次数、出行位置子序列及各要素相应的空间离散程度信息作为出行时空规律性的指标,提出了寻找规律通勤者的方法。(3)对微博签到热度数据的时间序列进行分析,并融合相对静态的POI数据,判断网格职住类型。验证了本文提出的时空离散化、时间序列化分析模型对散点日志类型的数据进行分析、揭示城市人群活动时空规律的可行性。本研究为时空事件数据集的分析和挖掘提供了模型与思路。生产生活中许多应用领域都积累了大量的使用日志数据,其中很大一部分数据都可以建模为时空散点数据集,这些数据集本身信息密度较低,应用本文的时间序列化分析模型,可探索数据集中可能隐含的人群或物体的时空活动规律,或城市空间结构的信息。