改进K近邻算法在城市轨道交通客流预测的应用

来源 :北京交通大学 | 被引量 : 8次 | 上传用户:qq350645682
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的飞速发展,道路交通的拥堵问题也变得越来越严峻。城市轨道交通具有运载能力强、正点率高、节能环保等优点,所以人们选择城市轨道交通作为首要出行方式,这也直接导致了客流的快速增长。客流预测作为智能交通系统中的重要组成部分,在帮助运营部门做好调度,协同交通资源和避免乘客大面积的拥堵问题上发挥了很大的作用,进而成为缓解地铁线路客流超负荷运行的重要手段。K近邻算法作为客流预测的方法之一,其方法具有不需要对数据进行假定,对异常的数据不是很敏感,预测精度较高的优点,所以广泛应用到客流预测中。但是传统的K近邻算法存在一定的问题:原始历史数据的预处理不足;状态向量的选取方式不够科学;在进行模式匹配时算法查询速度过慢;并且采用恒定近邻数K值,导致预测误差过大;K近邻算法没有误差反馈,不能对算法进行调节。本文对以上陈述的问题进行改进,以北京地铁客流数据为例,客流数据从城市轨道交通自动售检票系统所得。由于城市道路交通与城市轨道交通客流变化的相似性,将城市道路客流预测方法引入到城市轨道交通客流预测中,并对该预测算法进行以下三点的改进。(1)对历史数据的处理进行改进。采用采取阈值法对历史客流数据进行异常值筛选,对阈值的设定采取3c准则选取,对异常值采用历史平均加权法进行修正,并且将天气数据加入到客流数据中;最后选择主成分分析法对状态向量的分量进行选取。(2)对历史数据库进行改进。将上一过程处理好的历史数据进行聚类分析生成聚类中心点和聚类数据簇,分别存在两个子库内;利用哈希函数完成当前客流状态与历史数据库中聚类中心点的匹配,以满足算法实时性。(3)对预测算法进行改进。利用动态K值法,对不同的数据簇选择不同的近邻数K;将误差反馈加到相似度量准则上,以便对误差进行修正。最后,本文选取工作日和节假日地铁二号线复兴门站和地铁四号线天宫院站的客流数据进行实例分析,得到实验结果并论证该改进方法是与传统K近邻算法以及其他预测算法的性能更好,在一定程度上大幅提升了预测精度,同时针对该研究也提出了一些未来的研究方向。引用参考文献74篇,中文文献41篇,英文文献43篇,图44张,表14张。
其他文献
目的:对神经内科患者护理管理中开展安全教育的效果进行探讨。方法:选择我科2016年1月至2016年12月收治的384例神经内科患者,随机分为观察组和对照组,其中对照组192例,观察组
美术教育绝不是单纯的技术教育。"综合·探索"学习领域以综合为形式,探究为方法,强调在保持美术课程学科特质的同时,注重本学科各学习领域之间的横向联系,强化从跨学科的角度
乳腺癌是世界上最常见的女性恶性肿瘤之一,其发病率在我国呈现逐年上升的趋势。目前针对乳腺癌治疗的手段依然比较局限,不能有效地控制术后肿瘤的复发和转移,这导致中、晚期
本文论述黎族打柴舞的历史渊源,并对黎族打柴舞的传承与变迁加以探讨。
语法化是现代汉语中实词演化为虚词的一种重要途径。"给"作为语法化的典型代表,从动词向介词、助词发展,处于未完成且同时具有几种词性的状态,我们试从各个共时平面对其进行
本文分析了我国高校会计教学现状及存在的问题,深入剖析问题的形成原因,并对我国高校会计教学理念的更新和教学方法的改革提出自己的相关看法。
<正>中草药中的主要有效活性成分有多糖、甙类、生物碱、挥发油类、蒽类和有机酸类等,起着调节动物机体免疫功能的作用。枸杞多糖具有提高和增强免疫系统中T淋巴细胞、B淋巴
通讯与消息是新闻报道最重要的两种体裁,也是最常用的两种体裁,区分清楚两种体裁对每一个从事新闻工作者来说都是非常重要的,也是非常必要的。本文分别从外边形式,时效性,详
对外承包工程作为我国“走出去”战略的主要形式之一,在近几年得到了快速发展。但在发展的同时,我国对外承包工程企业也面临诸多制约因素,存在着很多需要解决的问题,低价竞标
<正>在当前时代背景下,传统媒体与新媒体融合发展,可以说是文化产业发展的趋势。作为现代服务业的主要内容,文化产业不仅为生活服务,而且为生产服务。目前,传统媒体行业正处