论文部分内容阅读
城市出租车轨迹数据在记录城市交通状况的同时,也在一定程度上反映了人们的日常出行。数据中包含的乘客上、下车点代表了日常出行的出发地和目的地,利用空间聚类方法可以从中探测某时段内人们出行的热点区域,从而为城市管理与交通规划等提供信息辅助和决策支持。文献[1]中根据出租车轨迹点沿道路分布的特点,提出了一种基于决策图[2]和数据场[3]的轨迹聚类方法,并用于城市热点区域的提取。该方法利用数据场来描述轨迹点之间的相互作用,利用决策图来选取聚类中心,能够有效地用于出租车轨迹数据中探测城市热点区域。但是该方法在聚类过程中,需要度量任意两个轨迹点之间的距离,时间复杂度较高,提取热点区域的效率主要取决于轨迹点的数量。当轨迹点的数目较多时,该方法提取热点区域的效率较低。针对该问题,本文提出了一种基于格网划分的聚类方法并用于大样本量轨迹数据的热点区域探测。首先,对研究区域进行格网划分,然后统计每个格网单元内乘客上车和下车的次数,接下来利用基于决策图和数据场的轨迹聚类方法对格网单元进行聚类,从中发现城市热点区域。改进后的格网聚类方法的计算效率主要取决于格网单元的数目,实验表明该方法能够有效地用于大样本量的轨迹数据中探测城市热点区域。最后,利用武汉市2014年5月1日(节假日)、5月7日(工作日)和5月10日(周末)期间8:00-9:00、12:00-13:00、18:00-19:00、23:00-24:00等四个典型时段内9700辆出租车轨迹数据进行实验,分别探测不同时段内乘客上车和下车的热点区域,从而进一步分析了不同时段乘客上车和下车热点区域的变化。