论文部分内容阅读
区域热点分析直接关系城市规划和城市道路状况,同时也是智慧城市建设和发展的重要领域之一,而区域内的轨迹数据是研究区域热点的重要信息之一。区域热点不仅可以为道路交通管理提供多种有效的参考意见,还可以对城市未来的发展规划提供一定的理论依据,并且还可以从侧面展现居民的日常出行特征。针对当前区域轨迹热点研究所面临的挑战和困难,本文基于所获得的网约车数据,对区域轨迹热点的分析做出相应的研究。区域内的热点分析,是指对区域内的居民出行特征、区域中流量较大、聚集程度较高的位置挖掘。通过对居民的日常出行行为研究,分析出区域中潜在的热点位置或者称为聚集密度较高的位置。本文的研究内容如下:1)数据预处理。本文使用成都市二环和西安市二环的网约车轨迹数据。为使结果不受数据噪声点的影响,所以首先需要对获取到的数据进行数据清洗,称为数据预处理。对于绝对偏离轨迹区域的位置点,采用直接删除的处理。由于数据集中存在多个属性,但并不是所有的属性在实验中都需要,所以对不需要的属性进行删除操作。将进行了粗粒度处理后的数据集进行地图匹配。本文提出了一种Kal-HMM(Kalman-Hidden Markov Model)地图匹配算法,改进了传统地图匹配算法中精度欠缺和时间效率低的问题。首先对轨迹进行偏离点去除,根据角度差确定偏离点,对去除偏离点的数据进行卡尔曼滤波(Kalman Filter)预测以补足去除掉的点,最后将处理后的网约车数据进行HMM地图匹配算法,得到轨迹点与实际地图的匹配。2)出行规律分析。使用网约车轨迹数据,从中选取居民日常出行产生的OD(Origin起点,Destiantion终点)数据,将数据通过时间属性划分为国庆假日部分、工作日部分和双休日部分。为降低环境、天气等非主观因素对结果产生的偏差影响,故对工作日和双休日两部分的数据分别计算平均值,将该平均值加入到评估过程中。按小时为间隔解析国庆假日、工作日、双休日的出行数量和出行时长,然后将双休日和工作日的数据处理结果进行比较,研究居民在不同时域的出行特点。3)区域流量预测。本文提出一种TCN-LSTM(Temporal Convolutional Network-Long Short-Term Memory)流量预测算法,用来预测成都市二环的流量情况。通过TCN算法提取出数据集中的特征,具体为根据数据集中的经纬度、时间、最低时长、最高时长、平均时长等信息,构造出多个一维卷积核,然后使用卷积核提取出各维度上的特征信息。在LSTM的循环层前面增加扩张卷积以此来获取当前时刻中所包含的信息量,这样能够显著的简化算法结构,优化算法处理速度与提升预测结果的精度。最后将从数据集中留出的测试集放入TCN-LSTM算法中,实现对时间段内的流量预测。4)区域热点分析。对于区域内的热点分析,提出一种MC-Kmeans(Mahalanobis distance-Canopy-K-means)马氏聚类算法用来分析区域的热点。首先使用1)中提到的成都市二环数据集,将数据集进行Canopy算法聚类,得到聚类结果6)′,即将数据划分成6)′类。然后将6)′作为K-means算法的K值,进行第二次聚类,在进行K-means算法的过程中,使用马氏距离作为选取聚类中心的公式。最后得到MC-Kmeans算法的聚类结果,并使用热力图的方式进行可视化。