论文部分内容阅读
城市路网交通系统是一个高度复杂的非线性系统,准确评估路网时空交通态势,深入挖掘其复杂的运行规律,对于提高城市交通运行效率和智能化管理水平具有重要的理论意义和实用价值。随着感知、通信及智能计算技术的快速发展,如何从海量、高维、多样化的交通时空数据中挖掘潜在的交通状态变化模式和特征,为交通管理部门和公众出行提供高效准确的信息服务,是智能交通领域面临的重要挑战。本研究从数据驱动的角度,采用先进的机器学习、信息论等数据挖掘和分析方法,结合交通流理论和网络理论,提出了基于时空数据挖掘的城市道路网络交通态势分析及应用的研究框架。本文按“时空特征提取—因果关系挖掘—频繁模式识别—未来状态预测”的逻辑主线展开研究。首先,提出一种基于非负张量分解考虑路网交通状态多维度特征的同质时空模式提取方法。在时间维度上提取了长期和短期变化特征,在空间维度上定义空间邻近系数,修正高斯相似度矩阵。基于改进的谱聚类算法将城市大范围路网分割为具备同质交通时空状态模式的子路网。其次,构建考虑信息传递方向性的路网时空状态因果关系挖掘方法。引入传递熵算法量化交通状态时空因果关系,利用滑动窗口技术和高斯核密度估计的方法计算传递熵矩阵,表征各路段之间的动态信息传递量。提出被影响系数、影响系数、输入度及输出度指标,识别路网上的关键路段。随后,提出基于时空因果关系挖掘的交通拥堵传播模式识别模型。利用传递熵计算交通状态信息传递量以及拥堵事件之间的因果关联性强度。考虑拥堵事件发生时间的连续性和空间拓扑的连通性约束条件,基于因果关系显著性检验去除冗余的关联关系,建立路网交通拥堵状态时空传播有向图集。采用频繁子图挖掘算法,识别频繁拥堵状态时空传播模式。最后,构建考虑时空信息的城市路网交通状态预测模型。选择历史上下游交通流量作为特征变量,利用梯度提升决策树集成学习算法,预测短时交通流量,并识别变量的重要性。基于传递熵的变量选择方法提取贡献度高的时空特征变量,显著降低了模型的特征维度和复杂度,提高了预测精度和效率。本研究为交通时空数据挖掘和分析提供了系统性的研究思路和方法,促进了交通态势建模与时空数据挖掘的交叉融合,为城市交通拥堵治理、路网规划等提供决策支持,为数据驱动下的智能交通系统提供基础技术支撑。