论文部分内容阅读
公交车、地铁和出租车作为城市居民日常出行的主要公共交通工具,其轨迹数据和刷卡信息中蕴含着丰富的居民出行行为信息,通过对这些多元流数据进行挖掘,可发现居民出行的不同模式。居民出行模式挖掘的常用方法为聚类分析,而传统聚类方法不适用于含有丰富时空信息的地理数据,因此,需要对传统方法进行时空扩展,以满足研究需要。本文以深圳市的出租车轨迹数据和公交车及地铁刷卡数据为实验数据集,通过不同区域内居民出行使用三种不同交通工具的数量和比例的统计,来探索性分析居民出行潜在的规律,然后利用基于邻接关系的时空谱聚类方法来挖掘具体的居民出行模式,并从交通工具的使用关系、社会背景和出行移动三个方面来理解和分析居民出行模式。本文的主要研究工作如下:(1)谱聚类方法的时空扩展谱聚类可对任意形状的样本空间进行聚类分析,且聚类结果能收敛于全局最优,具有很好的应用前景。本文对谱聚类方法的原理和离散化方法进行了总结性介绍,指出谱聚类算法的关键步骤为相似性矩阵的构建,通过分析传统谱聚类构造相似矩阵的方法,发现仅利用欧式空间距离度量时空轨迹的相似性具有很大的局限性,因此,提出一种同时考虑时间序列相似性和空间邻接距离的时空相似性矩阵的构造方法,从而实现谱聚类的时空扩展。(2)多源轨迹数据的时空谱聚类多源轨迹数据分别来自于不同的公共交通工具,记录了丰富的时空信息和居民出行规律,若将多源轨迹数据融合使用,并借助时空谱聚类方法,则可根据聚类分析结果来获取更多有价值的潜在信息。鉴于多源轨迹数据间的相互独立性,需要先根据各交通工具在居民出行中的实际使用情况,建立相同的度量标准,分别计算各交通工具的出行使用量占总出行量的比例,即可把多源轨迹数据信息化归到统一的比例度量体系下,再依次计算各交通方式条件下的时空相似性矩阵。最后结合图像处理领域彩色图像色彩合成原理,把三种交通数据类比成假彩色图像色彩空间中的三个不同维度(RGB)信息,并参考彩色图像灰度化的方法,实现多源轨迹数据时空相似性矩阵的融合,从而完成多源轨迹数据的时空谱聚类,为居民出行模式的挖掘奠定基础。(3)居民出行模式的挖掘与分析利用基于邻接距离的时空谱聚类方法,对多源轨迹数据进行时空聚类,通过对聚类结果的分析和挖掘,发现5种居民出行模式。为了更好地理解出行模式的特点,分别从不同模式下的交通工具使用关系、社会背景以及出行移动三个方面进行分析,从而发现在不同区域及居民出行模式下,公交车、地铁和出租车之间的运营竞争及协同合作关系,以及不同社会背景区域内的居民出行对交通工具的选择差异性,并结合出行移动情况,说明各出行模式在不同空间区域的互动关系。