基于互联网搜索指数的地铁客流预测研究

来源 :金坤 | 被引量 : 0次 | 上传用户:zsdown520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市人口的快速增长,道路交通拥堵问题日益严重。智慧交通系统则是未来智慧城市系统不可或缺的一部分。轨道交通以其绿色、便捷、运量大等优点成为智慧交通系统(Intelligent Transportation System,ITS)的重要组成部分。各大城市皆大力发展轨道交通系统,地铁已成为人们出行的重要方式。乘客爆炸式的增长,给复杂地铁系统的有效管理和日常运营带来了巨大的挑战。随着信息技术的发展,地铁客流(Subway Passenger Flow,SPF)出行行为受多源信息交织影响,呈现波动性、随机性、异质性、多源、混频等特征。精确合理的客流预测是及时应对突发客流,制定合理运营组织计划,平衡运量需求和运能供给,调节日常生产运输,提高铁路服务质量,增加铁路部门运营收益,进而提升城市服务和管理水平的关键前提之一。当前,针对各个领域的单一复杂数据源,基于一类将数据信号先分解后集成的技术框架广受关注。对于非线性的SPF数据,先分解地铁客流数据为多个具有明显单一频谱特征的模态分支,再通过对每个分支预测结果的集成而实现精确预测的目的。对于多源数据SPF的预测研究,需要提出一种多变量特征融合的模型。目前,城市轨道交通自动售检票系统(Automatic Fair Collection,AFC)可以自动地获取大量的SPF历史数据信息,同时,互联网的日益普及为我们研究搜索引擎指数创造了有利的环境。这些信息给SPF预测带来了前所未有辅助机遇,有助于我们实现更稳健的SPF预测。随着互联网技术和人工智能技术快速发展,大数据挖掘、机器学习、深度学习等方法呈现出传统模型所不具备的众多优点,其更善于捕捉复杂数据结构的动态变化特性。综上,本文基于多源数据信息特征分析,借助大数据挖掘,机器学习,深度学习,统计分析等不同智能模型的优势,提出合理的理论框架,通过对多种技术模块优化组合,构建一类基于多源数据信息驱动的综合集成地铁短期客流需求预测模型。本文创新地提出融合互联网搜索引擎指数的SPF点预测和区间预测模型。点预测模型框架包括以下几个方面:(1)多源数据特征:对与SPF相关关键词的百度指数(Baidu Search Index,BSI)的收集、降维和统计分析,进而筛选强因果性的百度关键词。(2)多特征数据融合:基于多目标优化的多模态分解技术,将SPF和相关BSI分解成具有单一特征的一簇本征模态函数;进而,为消除统计学上的伪因果关系,对每一簇本征模态函数进行了二次特征提取,从而形成最优特征组合,其作为每一簇的特征输入。(3)模型匹配策略:针对每个最优特征组合的结构和波动性,建立模型匹配机制分配相适应的预测模型。(4)综合集成框架的建立:基于综合集成思想,考虑各模块的优势和系统误差的平衡,提出集成方法,建立综合预测模型。进而,针对高复杂性和不规则数据,作为对点预测精度不够的补充,我们提出了一种新的区间预测方法。通过在一定的置信水平下构造上下界,模型不但可以比点预测提供更多的不确定信息,也解决了已有研究建立在估计点预测结果基础上构造区间预测而造成的误差累计现象。本文提出的基于上下界估计的方法融合了多源数据特征、多目标优化、深度学习等技术优势,预测框架主要集成了以下几个模块:(1)根据2018年中国三大搜索引擎各自的市场份额占比,我们首先加权了百度指数、搜狗指数和360指数得到搜索引擎指数(Search Engine Index,SEI)。为了获取有辅助作用的SEI作为强有力的预测因子,通过统计检验的方法筛选出与SPF存在因果关系的SEI。(2)有效地提取已经筛选预测因子中隐藏的辅助信息,精确的融合匹配策略显得尤为重要。首先,多目标优化的多模态分解技术分解多通道输入的SPF和SEI为具有明显单一特征的本征模态函数矩阵,将矩阵中存在相似周期和频率的模态函数视为一个信息簇,从而形成多簇结构。然后,对每个簇内部的本征模态函数二次抽取来消除因统计学检验而产生的伪因果关系,多簇最佳输入组合的本征模态函数被获取。最终,最佳组合输入到具有适当结构的多目标优化深度学习模型直接预测输出每个簇的上下界。(3)分解技术降低时间序列复杂度,融合匹配策略提高模型的预测精确性,集成技术强化模型板块的泛化能力,基于此,分别叠加每个簇预测的上下界得到最终区间预测结果。最后,北京、上海和广州SPF数据被用来验证所提出模型的最新技术水平的功绩。我们提出模型与设计的基准模型的实验结果表明无论是点预测还是区间预测都取得了精准的预测结果,以北京为例,一步点预测误差MAE=5.3117,MAPE=0.7319%,RMSE=79.7419,R~2=0.9991;区间预测误差PICP=0.9041,PINDE=0.0019,PINAW=0.0768,CWC=0.0768,Ws=-20.5061。因此,本文提出的融合多源互联网搜索引擎指数和多模态分析的SPF预测方法能提供了优异的预测性能,有助于改善轨道交通运营管理和提高运营效率。所提出的技术框架也对处理多源信息,多变量融合提供了技术借鉴。
其他文献
研究背景和意义诺如病毒(noroviruses,NoVs)是导致各年龄段病毒性胃肠炎的主要病原体。NoVs感染造成了全球巨大的的经济损失,导致了严重的公共卫生问题。开发一种有效的NoVs疫苗或抗病毒药物对于预防和治疗NoVs性胃肠炎具有重要的意义。然而,自发现NoVs以来,由于缺乏成熟的细胞培养系统,亦无合适的小动物感染模型,导致对NoVs发病机制的研究进展缓慢。目前尚缺乏针对NoVs胃肠炎的有效
三维模型虚拟表示真实世界物体的形状外貌,用户能够通过多视角观察其外观获取全面准确的认知。而知识抽取主要以文本为主,更具表现力的非文本资源很难用自然语言描述,构建易用的三维模型知识库仍然十分困难。三维模型低层特征提取、高级语义标注支持描述语料的抽取,但以知识的形式组织三维模型视觉信息的描述语料、代表观察视图及显著区域曲面等抽象表达为一体的研究仍有所欠缺。观察三维模型的视角无限,如何选择少量且尽可能代
随着经济的高速发展,化工类企业迅速崛起,直接服务于工业发展、国防建设和人民生活等各个领域的危险品的种类和数量在不断增加,这给危险品运输行业带来了很大的发展空间。由于危险品的特性,危险品运输过程中一旦发生事故,容易造成较大的人员伤亡和财产损失。我国危险品运输市场主要以道路运输为主,驾驶员作为驾驶过程中的决策者和操作者,在驾驶过程中对客观环境中的潜在风险产生认知错误时,会导致驾驶员采取错误的驾驶行为,
在人们的认知中,以降雨或降雪形式出现的降水通常会对城市交通产生无法预测的影响,增加交通事故的发生率。现如今出租车作为城市公共交通系统极其重要的组成部分,时常用来分析或评估交通的运行状况。因此在本研究中,将采用出租车GPS轨迹数据,对不同降水条件下的出租车运行时空特性进行分析研究。本文首先对兰州市2021年的部分出租车轨迹数据进行数据预处理,并进行相应的出租车运行速度和载卸客点数据的提取。其次,对出
背景及目的:近年来全球细颗粒物(particles with aerodynamic diameters of less than or equal to 2.5μm,PM2.5)和可吸入颗粒物(particles with aerodynamic diameters of less than or equal to 10μm,PM10)的污染形势非常严峻,其被认为是多种疾病的危险因素,但其与糖尿
第一部分:心力衰竭生物标志物在老年慢性心力衰竭患者病情评估中应用价值1.目的了解老年慢性心力衰竭患者心力衰竭生物标志物血浆B型脑钠肽(BNP)、血清C-反应蛋白(CRP)、血清心肌肌钙蛋白I(cTnI)水平与老年慢性心力衰竭患者心室功能、左心室重构之间的关系,探讨心力衰竭生物标志物血浆脑钠肽(BNP)、血清C-反应蛋白(CRP)、血清心肌肌钙蛋白I(cTnI)在老年慢性心力衰竭患者病情严重程度评估
研究背景糖尿病心肌病(Diabetic cardiomyopathy,DCM)是糖尿病常见的一种心血管并发症。高糖高脂刺激心肌细胞增加活性氧生成和细胞凋亡,引起DCM发生。高糖高脂影响线粒体动力学,导致线粒体融合减少、线粒体分裂增加。而抑制过度的线粒体分裂能够减少高糖引起的活性氧生成和细胞凋亡。高糖还影响线粒体生物发生,导致ATP生成减少。分泌卷曲相关蛋白 2(Secretedfrizzled-r
机动车保险(本文简称车险)是财产保险的重要组成部分。车险是我国财产保险业务中的第一大险种,对开展风险管理、组织经济补偿、促进社会稳定发挥着积极作用。车险费率是车险经营管理中的一个核心要素。车险费率是否合理、充足、公平,在微观、中观以及宏观层面均存在深刻的影响。具体而言,微观上从广大车险消费者角度看,车险费率不仅影响车险消费者保费支出与保险保障之间的投入产出关系,而且参与了国民经济的分配与再分配过程
通过网络订购快餐的餐饮消费模式自2010年出现以来,发展至2015年该种订餐模式已成为餐饮业中非常流行的消费模式。这种模式以互联网为通信载体,通过各种应用软件,在顾客与餐饮店之间建立了订购快餐的信息渠道,依靠众多外卖人员负责餐饮食物和物品的线下交付。该种服务模式因融合了互联网通信与线下交付过程,被称作O2O模式下的外卖订餐模式。这种模式被广泛应用于物流配送与外卖市场中。外卖市场在这种模式催动下,经
公司治理行为研究的重要目标是通过探索个体认知和个人行为以打开公司治理运作的“黑箱”。利益相关者在公司治理领域中扮演着重要的角色,但是相关研究还不足,存在诸多问题亟待解决,比如,利益相关者如何看待以及应对公司治理中存在的问题?对待同一问题,不同利益相关者之间是否存在差异?利益相关者参与公司治理能否提升公司价值?董事高管责任险(以下简称,D&O责任险)作为一种风险管理工具引入上市公司以来,其作用效应一