基于强化学习的新型列控系统区间行车间隔控制方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:liongliong529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市轨道交通(城轨)作为我国大中型城市公共交通的核心,是市内通勤人员出行的首选方式。近年来,随着城轨的快速发展,城轨客运量呈逐年增长的趋势。在城轨运营网络已成型的条件下,利用先进技术进一步缩短列车追踪间隔、提高行车密度、充分释放线路运能是满足城轨客流需求的重要手段。现有的城轨采用基于通信的列控系统实现的是“撞硬墙”的移动闭塞技术。该方式由于只考虑前车当前的静态位置信息,在一定程度上限制了线路运能的释放。基于车车通信的新型列控系统实现的是“撞软墙”的理想移动闭塞技术,在充分考虑前车位置、速度、加速度等更多动态信息,能够进一步缩小列车运行间隔、提升系统运力。论文针对新型列控系统的列车控制方式,基于强化学习、模糊控制等算法,对列车区间追踪间隔控制问题进行研究,论文的主要工作如下:(1)研究基于车车通信的新型列控系统的系统结构和主要功能,分析新型列控系统与传统列控系统在系统结构、通信方式及列车控制等方面的差异。根据城轨列车特点建立列车动力学模型,分析列车ATO控制性能指标为列车间隔控制指标的制定提供参考。(2)基于新型列控系统的“撞软墙”技术构建列车间隔控制系统模型,采用蒙特卡洛树搜索算法(Monte Carlo tree search,MCTS)对列车区间运行间隔控制问题进行研究。MCTS算法用于生成列车动作序列,实现对列车未来运行轨迹的预测;采用动态规划算法(Dynamic Programming,DP)对动作序列处理,以获得更具远见性的列车控制策略;在判定列车运行安全的前提下,执行列车控制策略。建立列车间隔控制指标,对基于MCTS的列车间隔控制算法进行评价。(3)针对在线的MCTS算法在列车当前状态距离控制目标较远时所存在的运算效率问题,引入模糊控制对算法进行改进。采用二维Mamdani型模糊控制器对模糊控制算法进行设计,并基于MCTS算法的运算数据生成模糊规则表。形成了以强化学习和模糊控制为核心的集成智能列车间隔控制方法。(4)仿真对比三种不同的控制策略生成方法,确定采用DP算法生成MCTS列车控制策略。对MCTS算法的不同搜索树深度进行仿真,确定树深度为7时算法的效率和控制精度最佳。为验证本文提出的控制算法实际性能,首先对列车区间追踪的多个运行场景进行仿真。然后,基于某一列车真实运行数据进行追踪间隔仿真。最后,针对同一列车追踪场景分别采用本文控制算法和模糊控制算法,进行列车追踪间隔仿真对比。论文研究结果表明,基于强化学习的新型列控系统区间行车间隔控制方法,在解决部分可观测、高维度、复杂非线性等控制问题方面,相比传统的控制算法具有响应速度快、调节时间短、控制精度高等特点,适合于新型列控系统区间行车间隔控制。图42幅,表8个,参考文献80篇。
其他文献
照明作为人类日常生活中的重要组成部分,其作用已经从最初的满足视觉明暗需求,到如今的营造丰富光环境带来舒适体验。在照明过程中存在大量资源浪费现象,如何既能满足舒适度需求又做到节能环保,成为了智能照明的研究重点。本文对光环境及计算机控制算法进行了深入研究,提出将神经网络应用于家居照明控制系统,实现家居照明的智能控制。首先本文将光照度及照度均匀度作为灯光调控的判断依据,通过对天然光、灯光的研究确定了室内
学位
疫情防控对铁路运输造成了巨大冲击,其主要特点是旅客运输量大幅下降。因此,为了满足铁路集团公司对疫情防控的需要,许多铁路运行线路被取消或调整。针对上述列车调整和机车分配问题,本文建立了混合整数规划模型,针对具体线路,分别考虑了运营成本和机车使用效率,优化疫情爆发期间的列车时刻表和机车分配。本研究成果可作为铁路集团公司处理铁路运输突发性中断及任何具有相同特征的运输中断的决策支持工具。本文第一章和第二章
学位
随着我国高速铁路的快速发展,中国铁道部在依照欧洲列控系统的基础上,设计了保障列车安全运行的控制系统CTCS-3,CTCS-3已经运用于我国铁路运营中。列控系统中车载子系统和地面设备是通过GSM-R无线来进行数据的交互,目前,GSM-R已经成功得在多条线路上实施,由于该无线系统是开放的,所以要面临开放式系统的威胁。我国根据EN50159中的防御措施,制定了RSSP-2安全通信协议。RSSP-2安全通
学位
人体检测与运动分析一直是计算机视觉领域的研究热点,在患者康复训练、视频监控、人机交互等方面都有着广泛应用。但是由于实际应用的场景十分复杂,使得人体检测与运动分析的研究工作还面临以下挑战:首先是检测网络中存在的不平衡问题影响了复杂场景下的人体检测精度;其次是人体形变、边缘模糊、与背景辨识度低等问题制约了人体检测的性能;最后是背景复杂与运动过快等因素导致动作的分析识别效果不理想。针对以上问题,本文提出
截至2020年12月31日,我国内地共有44座城市开通城轨运营,总计里程7715.31公里,运营车站达到5189座。截止2020年年底,北京地铁共有线路十六条,运营车站318座,承载着繁重的客运任务。地铁在行进过程中,往往会受到恶劣天气的影响,这些影响包括安全性、便捷程度、运营质量等。2016年7月20日受强降雨影响,北京地铁四号线、大兴线黄村西大街站至义和庄站上下行区段停止运营。2020年5月8
随着人因工程领域的繁荣发展,人因工程方法数量呈现递增的趋势。人因工程方法的多样化使得人因工程分析人员在解决复杂人机系统中人因问题时有更多的选择,但与此同时致使分析人员在进行方法的选择时难以做出决策,因此有必要对人因工程方法的适应性进行研究。本文在分析人因工程方法的适应性研究现状、结合其他领域的方法选择研究的基础上提出人因工程方法适应性分析的总体框架,构建了人因工程方法类别与人因问题的映射模型、人因
学位