论文部分内容阅读
随着经济水平的快速发展,道路交通的需求量也随之增加,然而城市交通拥堵导致车辆行驶速度降低、行程时间延长、排放尾气增加、出行成本上升,这直接成为了制约城市发展的重要问题之一。因此,短时交通流预测研究对城市智能交通系统的建设发展具有重要意义。短时交通流预测是根据历史交通流数据对下一个时间间隔的交通流量进行预测的过程,既有缓解交通拥挤、提高运输效率的作用,也为城市交通规划提供了有效的依据。
随着人工智能的发展,更多的机器学习模型和深度学习模型开始运用于交通流预测。机器学习算法使得回归问题的收敛速度更快,拟合的模型可以达到更高的精确度。在之前的交通流预测中,所用的模型都是基于比较浅层结构的算法,但是弱学习器所建立的模型不能很好地反应现实中的情况,后来便出现了集成算法,被大家所熟知的就是boosting算法、bagging算法和随机森林算法等。集成算法就是将各个弱学习器按照某种最优策略结合起来形成一个强学习器,这个强学习器能够更好地拟合模型。
在本文中,选用了极端梯度提升(XGBoost)算法来进行交通流预测。XGBoost算法收敛速度快,而且在收敛速度很快的同时不会丢失模型的鲁棒性。在之前的研究中,一般都默认均方误差(Mean Squared Error,MSE)为XGBoost算法的目标函数。实际上,目标函数的选择在XGBoost的应用中十分重要,对于不同类型的数据,应该选择不同的目标函数去建立模型。在本文中,选择了Huber损失函数作为我们的目标函数。
通过对交通流数据周期性、关联性的分析,选用月周期特征、周周期特征、前3天特征、前2天特征、前1天特征、前5分钟特征这6个特征属性,并对其进行特征重要性分析。利用该模型以及提取的特征进行交通流预测,实验结果表明:该模型优于基于均方误差损失的极端梯度上升模型以及基于平均绝对误差损失的极端梯度上升模型。同时,该模型较梯度提升回归模型、支持向量机回归模型具有更高的预测精度,各误差指标小,且模型训练时间短,符合短时交通流预测所要求的时效性。
随着人工智能的发展,更多的机器学习模型和深度学习模型开始运用于交通流预测。机器学习算法使得回归问题的收敛速度更快,拟合的模型可以达到更高的精确度。在之前的交通流预测中,所用的模型都是基于比较浅层结构的算法,但是弱学习器所建立的模型不能很好地反应现实中的情况,后来便出现了集成算法,被大家所熟知的就是boosting算法、bagging算法和随机森林算法等。集成算法就是将各个弱学习器按照某种最优策略结合起来形成一个强学习器,这个强学习器能够更好地拟合模型。
在本文中,选用了极端梯度提升(XGBoost)算法来进行交通流预测。XGBoost算法收敛速度快,而且在收敛速度很快的同时不会丢失模型的鲁棒性。在之前的研究中,一般都默认均方误差(Mean Squared Error,MSE)为XGBoost算法的目标函数。实际上,目标函数的选择在XGBoost的应用中十分重要,对于不同类型的数据,应该选择不同的目标函数去建立模型。在本文中,选择了Huber损失函数作为我们的目标函数。
通过对交通流数据周期性、关联性的分析,选用月周期特征、周周期特征、前3天特征、前2天特征、前1天特征、前5分钟特征这6个特征属性,并对其进行特征重要性分析。利用该模型以及提取的特征进行交通流预测,实验结果表明:该模型优于基于均方误差损失的极端梯度上升模型以及基于平均绝对误差损失的极端梯度上升模型。同时,该模型较梯度提升回归模型、支持向量机回归模型具有更高的预测精度,各误差指标小,且模型训练时间短,符合短时交通流预测所要求的时效性。