基于XGBOOST算法的某铁路局旅客发送量预测分析

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:dong770527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
铁路市场化是不可避免的趋势。铁路各个部门和各个路局都想开展收益管理,以此提高资源利用率,提高运营效益。想要实现收益管理,前提是对客流进行较为精准的预测。效果较好的客流预测将会给收益管理带来极大的方便,进而提高收益。中短期的客流预测是了解客流动态变化趋势的重要手段,是铁路运营部门进行合理营运管理的基础。伴随着互联网售票的逐渐建立和完善,铁路客票系统的数据得到了质与量的保障,积累了丰富的历史数据和有用信息,而借助这些现有的资源和数据进行分析与挖掘,并优化客流预测精度成为了铁路运营部门以及信息技术部门的关注重点。本文主要研究基于XGboost的铁路旅客发送量中短期预测问题,旨在充分利用历史数据中的有用信息,预测近期内的客流的走势和规模。本文首先阐述了客流预测领域的常用方法、基本原理、方法的优缺点、以及神经网络理论的原理、XGboost算法的原理以及应用方法,阐明了各个方法的优缺点以及采用神经网络和XGboost算法的原因。接着分析了客流内部的周期规律、观察日期前预售累积数据的价值,找出了影响客流的相关因素。在此基础上,进行数据清洗、特征处理,以及介绍了采用的理论和方法。之后利用处理好的数据,分别基于神经网络和XGboost理论设计模型,并进行预测。论文的最后选择了基于国内某铁路局铁路旅客发送量的真实数据进行模型效果验证,并将神经网络模型和XGboost模型的测试效果进行了对比。
其他文献
项目型制造简称ETO(Engineer To Order),即面向订单设计,是生产大型复杂产品的采用项目管理方法的制造类型。供应商的表现对项目型制造企业的绩效影响很大,供应商的质量、价格、交货期和服务是最关心的指标,而其中质量又是重中之重。对项目型制造企业的特点、发展现状和问题进行了归纳,并总结了项目型制造企业供应商管理和供应商选择的相关理论。通过对项目型制造企业与非项目制造企业对比,分析了供应商
我国正处于城镇化加速阶段,导致城市风环境逐渐恶化,寒地城市因其独特的风环境特征,冬季雾霾频发的同时还伴随着热舒适度差的现象,与非寒地城市风环境问题截然不同。目前关于城市气候的研究已初具成效,但研究成果难以与现有城市规划或城市设计进行衔接,导致关于城市气候研究的成果无法落实。改善城市风环境首先从需要城市整体角度出发,通过城市整体层面结构优化和空间形态控制,进而达到改善城市气候环境的目的。2017年3
当前,STEM教育在中国进入蓬勃发展阶段,时代发展与社会经济的推动使得STEM教育面临着前所未有的机遇与挑战。凝心聚力,砥砺前行,我国正尝试探索出一条中国特色的STEM教育道路,STEM教育被纳入国家战略发展政策,各地相继推行STEM课程试点学校申报,STEM教育研究在理论与实践方面取得一定进展。但与此同时,当前教育体系下的课程模式制约着STEM教育的推行,STEM课程开展的有效性与课程设计的规范
协同过滤推荐算法是一种当下应用广泛的推荐技术,是智能电子商务的重要组成部分。虽然传统的协同过滤算法已经实现了智能推荐,但是其推荐精度任然不高,推荐结果的个性化程度
我国《民法总则》第十条的规定,首次从立法层面确立了习惯的法源地位,交易习惯作为习惯的一种,具有解释、补充合同和鼓励交易等意义。根据我国《最高人民法院关于适用<中华人民共和国合同法>若干问题的解释(二)》规定,交易习惯是某地区、某行业或当事人之间的习惯做法,并且主观上要求“知道或应当知道”,结合自身的时间性、领域性、主体特定性等特点,交易习惯为大众或特定人所熟知、应知的,且被重复使用的社
传统的紧耦合网络为人带来便利的同时,其诸多弊病也为越来越多的人所诟病。因此,近年来许多人都开始研究和探索新的网络体系结构,软件定义网络(Software Defined Networking,
创新是一个国家经济健康发展的关键,核心技术的自力更生更是关系到国家安全与经济命脉,而企业创新是国家创新的经济基础。作为创新型企业不断创新的重要驱动力,风险投资为企
农业是我国经济发展的基础,而农业现代化是整个国民经济现代化的基础。由传统的依赖投入大量要素的粗放型农业经济增长方式转变为通过农业全要素生产率增长为推动力的创新驱动型增长方式,是实现未来中国农业经济可持续发展的关键所在。乡村振兴战略提到“发展乡村普惠金融,优化金融资源配置”,强调了农村普惠金融发展在农业现代化进程中的重要作用,为新农村建设指明了方向。本文以金融发展理论为基础,普惠金融相关理论、金融对
随着计算机存储技术的发展,日常生活中产生了海量数据。对大规模数据进行分析,从中挖掘出隐藏的有价值的信息逐渐成为当今时代的热点。聚类技术和降维技术是两种常用的数据分析方法。聚类用以寻找数据内在的分布结构,降维用以缓解维度灾难。但是传统数据分析方法在分析海量高维数据时存在操作过程繁琐,分析准确率低等缺点,因此研究用于同时实现聚类和降维的高精度模型势在必行。本文首先提出了基于曲线距离分析的嵌入式聚类算法
随着现代光学事业的迅速发展,超精密光学产品已经广泛应用到了各种高新技术行业,尤其是大尺寸光学元件在航空航天等领域有大量的需求。由于精密光学产品的制造工艺复杂、难度