论文部分内容阅读
智能交通系统对城市交通的疏导、道路监控、车辆管理和交通流智能分析有着重要作用,是解决道路拥堵、提高通行效率、指导人们出行的一种智能解决方案。构建智能交通系统的关键就是研究如何从被动的交通信息收集、发布,变为主动对交通信息进行分析、预判、管理与服务等。车辆行程时间估计是交通预判方面的重要问题之一,当前交通预测理论主要是从城市交通和交通流等系统的角度去研究城市整体车辆的道路行程时间问题,对城市的规划发展与路网建设起到积极的作用,但是,这些理论较少从单个车辆的角度去研究车辆的行程时间预测问题,难以从便民的角度为百姓的出行提供个性化的短时行程时间预测服务。目前,大数据日益成为各行各业关注的热点研究课题,通过分析数据的规律性和相关性,能够为人们解决行业问题带来全新的视角,所以,对交通数据的分析也将有助于我们更好的解决交通问题。在实际的交通环境中,道路及车辆产生的交通数据往往具有相关性、异构性、不确定性以及时间顺序性等特征,然而较少有预测模型是专门针对交通数据设计的。本文重点研究单车在短时交通中的行程时间预测问题,首先针对车辆行程时间数据特性建立预测模型,随后,为了解决该模型的实时性问题,对预测模型的状态空间问题进行了研究,最后讨论了如何对交通道路特性建模,利用本文提出的两种预测模型,给出了单车道路行程时间的实时预测方法。针对交通数据的时间序列特性和不确定性,利用信息熵理论,解决了交通数据的离散性距离度量问题,改进了初始数据距离计算的方法,实现了数据的时间性和前后关联性的统一,并给出了相应的距离计算标准。同时,还给出了基于该距离计算的自适应聚类算法(TSCTSC, Time-Series Clustering algorithm base on Temporal and Similarity Criterion),增强了聚类算法的鲁棒性,使得聚类过程能够自适应的找出聚类个数,不需要人为提前设定,最终达到通过自适应聚类来分段的目的。基于TSCTSC的自适应聚类,本文提出了基于该聚类方法的隐马尔可夫模型预测模型,针对模型状态序列的学习问题,改进了维特比算法,使得模型能够以线段为观测序列寻找最优状态序列。另外,为了保证基于该聚类方法的隐马尔可夫预测模型能够适用于多步预测,增大模型的预测区间,提出了一种迭代优化模型的方法,并给出了数学证明,论证结果表明该迭代方法能够有效提高预测效率。最后,在公共数据集上对算法进行了验证,该算法能够准确的预测交通行程时间数据,提高多步交通行程时间预测的精度,并在一定程度上解决了离散点距离度量问题。但是,上述隐马尔可夫预测模型是基于历史交通数据的静态预测模型,随着交通数据采集技术的提高,道路交通数据的准确性和实时性都有很大提高,因此需要研究能够利用实时交通数据的在线算法;同时,隐马尔可夫模型本身的一些假设前提,也限制了预测模型在实际应用环境中的预测能力。本文提出基于层次狄利克雷过程的聚类隐马尔可夫在线预测模型(HDP-CHMM, Hierachical Dirichlet Process-Cluster based Hidden Markov model),通过非参数估计的方法扩展隐马尔可夫模型,使得隐马尔可夫模型不受隐状态空间的限制,从有限状态模型扩展为无限状态模型,能够适用于在线预测,另外还提出了加速模型参数的截断采样算法,通过引入辅助变量将无限状态截断为有限状态,降低采样计算量,使得模型参数的训练收敛更快,算法耗时更低。通过在公共数据集、道路车辆数据集和一般数据上进行实验验证,该算法能够执行在线预测任务,在预测精度和实时性方面强于已有的隐马尔可夫预测模型。最后本文对道路特性进行了研究,结合道路交通的实际情况,考虑到局部路段间具有前后关联性,建立了预测车辆与目的地间的N阶近邻路网模型,该模型通过在一阶近邻道路的基础上迭代求交,得到该道路的N阶近邻路段集合,解决了道路的关联性问题。同时,根据该路网模型进一步建立了多依赖的状态矩阵,消除了传统隐马尔可夫模型一阶依赖的限制,更加符合实际交通应用,从而得到基于N阶近邻路网的隐马尔可夫模型。为了能够从车辆角度进行行程时间预测,在基于N阶近邻路网的隐马尔可夫模型和非参数估计的隐马尔可夫在线预测模型的基础上,构建了离线和在线两种算法结合的单车行程时间估计方法。实验结果表明,该模型对车辆在起始点与目的地间的行程时间预测精度较高,该方法的实时性也能够达到实际应用环境的需求。