基于集成融合算法的客流预测模型基于集成融合算法的客流预测模型

来源 :科技信息·学术版 | 被引量 : 0次 | 上传用户:netcapo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读


摘要:本文利用郑州地铁的乘客OD数据,对不同时间周期内的站点进、出站客流进行预测。利用深度学习网络,将数个弱回归模型集成融合成强回归模型。同时,利用参数修正算法对该模型进行进一步地增强。最终,通过郑州地铁真实数据对该模型进行了评估,得到了满意的效果。

关键词:集成融合;深度学习;回归模型

1背景

地铁是市民常用的交通工具之一,地铁的进站和出站人数会随着季节、节假日、工作日、周末、每天不同的时段等不同而发生变化,特别是在节假日、工作日的早晚高峰期,这对地铁工作人员进行实时管控提出了很大的要求。如果没有实时的掌握住每个时段的客流信息,那么将会对整个列车的调度造成很大的影响,也会给市民的出行造成很大的不方便。所以,对地铁客流进行预测是非常重要的。

本文提出了一种基于集成融合算法的客流预测模型,可以灵活地融合地铁OD数据、节假日、天气、特殊事件等信息,利用深度学习、机器学习、集成融合等方法,通过数据预处理、特征工程、模型建立、训练和评估这一系列的过程,进行站点/线路不同时间周期内进、出站客流量的预测。

本文后续章节安排如下:第2章,介绍客流预测模型的总体设计和重点算法;第3章,对客流预测模型进行测试评估,并且分析结果;第4章,进行总结和提出后续工作方向。

2总体设计方案

本次模型的总体设计方案如下图所示:

将需要预测的日期根据实际的分析结果,进行分类:

1.第一类是待预测日期对应的历史客流数据变化稳定在某一个非常小的固定范围内的数据,这类数据使用统计规则算法进行预测,得到的效果非常好。

2.第二类是待预测日期对应的历史客流数据分布变化不稳定、复杂的日期,这类数据使用DNN深度学习算法进行预测,得到的效果非常好,典型的就是周末、节假日。

3.结合统计规则算法和DNN深度学习算法的优缺点,我们使用集成融合算法对这两种算法进行集成、融合,达到更加好的拟合效果。

下面将对上述算法进行详细介绍。

2.1统计规则算法

统计规则算法的流程如下:

1.对预测日期分类:将预测日期分词工作日、周末、节假日3类。

2.对于节假日预测:

其中:N是指跟待预测日期类型(节假日)相同的历史数据,按照日期降序排序,取最近的N个日期。yreal表示的是跟待预测日期类型(节假日)相同的历史数据真实客流量。

3.对于工作日/周末预测

其中,N1是指跟待預测日期类型(工作日/周末)相同的历史数据,按照日期降序,取最近的N1个日期。N2是指跟待预测日期类型(相同的星期)相同的历史数据,按照日期降序,取最近的N2的日期。yreal表示的是跟待预测日期类型(节假日/周末/相同的星期)相同的历史数据真实客流量。

2.2DNN深度学习算法

DNN深度学习算法的核心步骤主要是特征工程

所谓特征工程的构建,主要是通过数据分析、相关性分析、AutoML等方式构建一些有价值的变量,作为模型的输入,主要包括以下变量:

■待预测日前7天对应客流数据

■前三周中与待预测日星期所在日相同的数据

■待预测日月份

■待预测日星期

■气温

2.3集成融合算法

集成融合算法同样是构建一个DNN深度学习网络,不同的是在进行构建一个新的DNN深度学习网络之前,会将上一个DNN深度学习算法的预测结果和统计规则算法预测结果作为本次DNN深度学习网络的一个特征作为输入,再次进行训练,达到集成融合的效果。

整个步骤最核心的就是特征的合并,也叫做张量连接,下面是张量连接的实现步骤:

■特征工程向量:

■深度学习算法预测结果:

■统计规则算法预测结果:

■张量连接:

3模型评估

3.1数据集

本次模型评估,根据星环公司提供的郑州地铁从2015年1月1日至2015年12月24日出入的客流量数据,利用提出的客流预测模型对未来一个星期(2015-12-25~2015-12-31)的客流量进行预测,根据官方给出的评价指标,通过评价指标在所有参赛队伍中的排名,验证我们的地铁客流预测模型的技术可行性。

3.2评价函数

本文使用模型平均绝对误差人数MAE来评价模型的好坏,具体的计算如下:

i表示站点,范围为[1,N],N表示站点的总个数,本次比赛中公有20个站点。

d表示天数,范围为[1,7],表示未来7天的客流量

表示预测出来的客流量,表示真实的客流量

3.3评估结果

利用前面介绍的数据集和评价函数,统计了参赛各队的结果。从中可以看到,我们团队的MAE值为1557.34,在所有参赛队伍中是最小的。更进一步的,本文提出的墨西哥比排名第二的湖南预测如神工院队模型的MAE值2734.67,足足小了1200多。这就足以说明本文提出的基于集成融合的客流预测模型,在所有参赛队伍中是最好的,取得了最优的拟合效果。

4结论和后续工作

4.1结论

本文利用郑州地铁的乘客OD数据,对不同时间周期内的站点进、出站客流进行预测。利用深度学习网络,将数个弱回归模型集成融合成强回归模型。同时,利用参数修正算法对该模型进行进一步地增强。最终,通过郑州地铁真实数据对该模型进行了评估,得到了满意的效果。

4.2后续工作

4.2.1多时间粒度+进出站验证

根据星环公司官方的要求,目前只是针对天时间粒度,对进出站的客流总数进行预测。但是天时间粒度相对来说会比较大,在实际的地铁运营需求中,时间粒度应该是小时、甚至是分钟,而且乘客的进出站规律也是不一样的,所以,后续需要对多时间粒度,特别是细时间粒度(比如1小时、半小时、15分钟、5分钟、1分钟)和进出站分别预测。

4.2.2多数据集验证

根据星环公司官方给到的数据,是2015年的乘客刷卡记录,我们知道随着时间的推进,地铁客流量会发生不断的变化。用2015年的数据建立起来的模型,是否适用于其他数据集,比如2016年、2017年、2018年、2019年则有待验证。所以在后续的工作当中需要利用多数据集进行来验证模型的稳定性。

参考文献

[1]贾锐军、冉祥来、吴俊霖、戴晨斌等,基于XGBoost算法的机场旅客流量预测[J],民航学报,2018年06期

[2]蒙特卡罗模拟,百度百科,https://baike.baidu.com/item/%E8% 92%99%E7%89%B9%E5%8D%A1%E7%BD%97%E6%A8%A1%E6%8B%9F/5160083?fr=aladdin

[3]小白都能看懂的蒙特卡洛方法以及python实现,CSDN博客,2018.

https://blog.csdn.net/bitcarmanlee/article/details/82716641

其他文献
摘要:随着移动通信的升级换代,5G通信对于金融行业有极大地推进,技术革新使得银行业务场景变得更加多样化。本文从5G、网络切片及边缘计算等相关技术出发,探讨这些技术能力在銀行业务体验式营销、多因子组合认证等实际业务场景中的应用价值。关键词:5G 边缘计算;网络切片;多因子5G相对传统3G\4G通信来说,有了划时代的技术革新,具有超高带宽、超大容量、极低时延等特性,同时通过与MEC、网络切片、云计算、SDN等新技术的融合应用,延伸出了新一代的更高质量的网络。5G网络结合IOT、Big Data、AI、云计算、
期刊
摘要:在建筑工程项目建设中,建设单位一般对工程项目的安全、质量、成本、进度的四个维度管理都会有构架体系、规章制度、管理要求等,而成本与进度管理对建设单位的经济效益、经营效率起到重要关键的作用,对企业的发展具有重要意义。本文主要针对产业园区工程项目的成本管理与进度管理的控制要点作一一论述,为建设单位对成本与进度管理水平提升作些有益的帮助。关键词:建设项目;成本管理;进度管理;控制要点1建设项目工程成本管理的控制节点建设项目工程成本管理可以分为策划立项、设计管理、招标采购、工程施工和竣工验收等五个阶段。1.1
期刊
摘要:随着新时代的大力发展,信息化已经逐渐渗透到人们的日常生活,“互联网+”目前已经成为一项全新的思维形式。在学习党史知识时,由于历史镜头的缺失,无法让人们得到良好的视觉效果,然而在VR这项虚拟现实技术的助力下,可以让枯燥的党史学习变得更有现场感,从而增强党史知识的感染力。为此,本文主要围绕如何通过VR助力让党史学习“活起来”进行探讨,希望可以提高党史学习的效果与吸引力。关键词:VR技术;党史学习;应用引言中国共产党的悠久历史是近现代以来最值得可歌可泣的篇章,全面展示出我党的辉煌成就、革命艰苦历史以及伟大
期刊
摘要:中国互联网己经有三十多年的发展历史,在获取广泛信息、促进人际交往、提供便利生活等 方面发挥着日益重要的作用。和传统企业相比,互联网企业具有发展迅速、盈利模式独特、收益不稳定的特点,因此研究互联网企业的盈利模式具有重要意义。关键词:多元化;互联网企业;盈利模式;影响研究一、引言随着我国经济的多元化发展,企业之间的市场竞争日渐激烈,特别是在信息时代,各国之间的贸易交流也急剧增加,企业想要在如此激烈的环境中生存与发展,多元化战略成为必然的选择,许多成功的企业开始生产剩余资源、开拓新市场或实施与企业发展无关
期刊
摘要:现代化社会的发展,人们从过去对物质的追求逐步过度到了对高品质、高思想的精神、文化层的追求,这既表示我国社会进入了新的一个阶段,同时也代表着我国人民的生活质量有了很大的提升。新时期期,群众文化的建设应该把握社会发展、把握群众精神层的文化追求、把城市文化的建设共同结合在一起,有目标、方向的构建符合社会价值、群众需求的文化内容,因此,这里围绕着新时期群众文化的建设与发展做研究,并有效推進现代社会的发展。关键词:新时期;群众文化;建设与发展引言:群众文化作为精神文明的基础,是社会发展群众追求最真实写照与象征
期刊
摘要:《黄河大合唱》是由光未然作词,洗星海作曲的一部大型合唱声乐套曲,其是当时音乐界的经典,也是我国近现代音乐的重要成就。这首乐曲出现在我国抗日战争最为艰难的时期,体现了中华民族坚强不屈的精神和崇高伟大的意志,让全世界人民都感受到了我们的精神和意志力。基于此,本文对《黄河大合唱》创作背景进行概括总结,并对其中蕴含的时代精神进行了分析。关键词:《黄河大合唱》;乐曲;时代精神引言《黄河大合唱》创作于1939年,其包含七种不同的演唱形式,全乐曲情感丰富,是一首非常经典的音乐作品,体现了中华民族面对侵略顽强不屈的
期刊
摘要:随着新媒体技术的快速发展和中国文化走出去的需求渐长,外宣翻译的重要性不言而喻。微信公眾号作为新兴传播手段,是极具潜力的外宣方式,与此同时,也对推文英译提出了更高要求。本文在外宣语境下探讨微信公众号推文的特点及翻译的不足,提出翻译策略,以期实现中国文化走出去的最终目标,也希望能为推动外宣翻译的发展献绵薄之力。关键词:微信公众号;推文;外宣翻译一、引言外宣翻译是展现中国传统文化的重要窗口,探索新颖的外宣方式对中国文化走向世界舞台尤为重要。笔者以“微信公众号推文”为关键词,以“中国知网”为搜索引擎,截至2
期刊
摘要:现阶段我国经济形势的变化,对国企的发展产生了重要的影响,国企想要在激烈的市场竞争中站稳脚跟,就要加强自身的管理和创新。国企工会在工作在外部环境改变的情况下,面临着重重的困难,为了更好地完成工会的各项任务,则需要国企工会直面困难,提出应对的策略。本文首先分析了当前国企工会在发展中面临的困难,然后提出了应对工会发展困难的策略,旨在促进国企工会的健康发展。关键词:国企工会;困难;应对策略前言:现阶段国企内部管理以及组织结构发生了较大的变化,然而部分企业对工会管理工作的重视度不足,导致国企对工会的作用缺乏正
期刊
摘要:BIM模型在民航机场建设中至关重要,为使其显示更具美感,应用本文作者的发明专利方法——“一种Metropolis光线追踪自适应两阶段采样方法”,在PBRT平台实现了对BIM模型的渲染,改善了BIM模型的视觉观感,有助于BIM在民航机场建设的应用。关键词:BIM模型;PBRT平台;Metropolis光线追踪算法;渲染;Abstract:BIM model is very important in the construction of civil aviation airport.In order
期刊
摘要:当前广播电视节目在多种类型尤其是网络新型媒体蓬勃发展的背景下,其传播范围不断地受到强大的冲击、广播电视节目的信息传播优势也日趋减小。新时期下的媒体环境要求从业者的素质时刻适应广播电视发展的需求,广播电视播音主持领域工作人员作为广播电视节目的核心应不断地提高其艺术创新力才能给受众带来直观的创新体验。本文就在分析和探讨创新艺术的必要性和重要性的基础上对创新广播电视播音主持艺术的途径和方法进行深入探究。关键词:广播电视;主持艺术;发展趋势;创新模式新时期下,随着国民的精神追求和文化素养也在不断地提高,对于
期刊