面向交通流量预测的数据处理与组合模型方案的研究

来源 :广东工业大学 | 被引量 : 3次 | 上传用户:q183727555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,随着人们生活水平的提高,我国的汽车拥有率大幅度提高,据国家统计局统计数据显示,我国2018年民用汽车拥有量为23122万量,这数据还在不断增长。如此庞大的交通基数往往伴随着一系列的问题,其中首当其冲就是拥堵问题。目前,由于车辆的激增,我国一些大城市公共交通基础设施建设正面临着一个巨大的考验,拥堵问题也因此成为了城市治理的焦点。治理交通拥堵较为有效的办法是提前精确预测交通流,然后提前对道路进行管制和导流。本文将选取道路平均通行时间作为衡量交通流量的指标,然后利用数据挖掘技术预测道路平均通行时间。本设计的数据来源为贵阳市132条道路在2017年3月至6月的道路数据(包括道路属性、道路拓扑结构、道路每两分钟平均通行时间),其中3至5月的数据作为训练数据,6月份的数据作为测试数据,并以平均绝对百分误差(MAPE)作为衡量模型精度的指标。本设计对132条路段在出行高峰[8:00,9:00],[15:00,16:00],[18:00,19:00]三个时间段中每两分钟的平均通行时间进行预测,主要的工作以及创新点包括:(1)对交通流理论、交通流预测方法、组合模型方法等相关技术进行阐述。(2)针对不同的交通数据类型提出合理的数据清洗方案。对交通流数据的预处理工作包括异常值判断、缺失值填充、数据变换、数据规约等。(3)由于交通流数据具有较强的序列相关性,所以本设计利用ARIMA时间序列模型对交通流数据进行建模。另外,考虑到交通流数据规律的复杂性,本设计还使用了XGBoost树模型和LSTM模型进行建模。其中,XGBoost主要靠人为提取相关特征来提升模型的效果,LSTM则是靠算法自动学习特征。(4)由于单模型在拟合过程中具有一定的局限性,本设计会对结果进行融合以提升模型的表现,在模型融合的过程使用了改进型的加权融合算法以及Stacking算法。其中,改进型的加权融合算法是用线性回归模型分别学习每个单模型的权重因子。在Stacking过程中,本文设计了两层分类器,其中,基分类器包括两个参数不同的XGBoost模型和两个不同参数的LSTM模型,元层分类器为一个线性回归模型。
其他文献
传统剪纸动画,是起源于中国的小众动画之一。在保留动画原则的前提下,更多地融入了中国民间剪纸艺术以及传统皮影戏的理念与制作手法,传承了中国绘画艺术以及对美学认知的精
氯代芳香族有机物是一类被广泛使用的人造化学物质,其中五氯酚、多氯联苯等剧毒有机物都是目前备受关注的持久性有机污染物,大量存在于表层土壤,其污染土壤修复是环境治理中
本文研究的主要内容是无线电罗盘导航系统的数字化,无线电信号产生与接收都在仿真平台上进行相对应的设计与实践。软件仿真完成后,进行无线电罗盘导航系统的数字化设计。设计电路图,选用合适器件,制作PCB,进行数据测试。验收的结果表明,无线电罗盘导航系统符合设计标准。本文开始介绍了无线电罗盘导航系统的国内外发展现状,介绍软件无线电技术的基本理论。从无线电半罗盘入手,介绍其导航原理,过渡到无线电罗盘。详细介绍
目的:探讨阻塞型睡眠呼吸暂停低通气综合征(OSAHS)患者Epworth嗜睡量表(ESS)评分与高血压的相关性,为临床评估高血压患者合并OSAHS提供简单易行的筛查方法,为判断高血压患者是否
商业银行是构成我国金融体系的重要组织机构,商业银行自股份制改革以来按照自负盈亏的市场化经营模式,这一特点就使得银行必须进行不断的服务水平提升和业务的改进。商业银行
本文于2015—2016年采用大田试验,研究了不同覆膜方式下对产量、水肥效应、土壤生物活性以及有机碳组分等的影响,试图探索当地最佳覆膜方式,从而为晋南旱塬地区乃至我国旱作
对图片进行简单的处理,对于专业性很强的PhotoShop一般人不会使用,而Windows自带的画图工具无需安装、易上手、简单好用、给生活带来了极大的方便。
从长远来看,医生工作室不仅是执业模式的改变,更是带动人事制度、支付制度、药品使用制度以及医院医学模式的改变。$$   最近一位我熟悉的皮肤科老专家,怒气冲冲地跑到我家
报纸
读图时代,新媒介生态环境和受众审美疲劳对传统专题摄影中影像语言的单一化进行着双重夹击。专题摄影报道作为新闻摄影中一种相对丰富和完整的报道样式,沿袭了传统新闻摄影的
负面新闻在众多因素的影响下呈现愈来愈多的趋势,对于负面新闻我们应树立正确、科学的态度,防止和缩小负面新闻产生负面影响,同时,我们也要看到负面新闻同样蕴含着丰富的思想