深度强化学习在基于车车通信的列控系统中的应用

来源 :北京交通大学 | 被引量 : 2次 | 上传用户：vista_momo

【摘要】

：

【作者】

：

张洋

【出处】

：

北京交通大学

【发表日期】

：

2020年01期

【关键词】

：

车车通信深度强化学习资源分配协同编队列车控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

我国城市轨道交通向智能化发展是势在必行的。当前普遍使用的基于通信的列车控制(Communication Based Train Control,CBTC)系统在长期的运营中,暴露出了许多的问题。例如系统中轨旁设备较多、接口复杂、车地通信时延较大等。这些问题会影响系统性能,增加系统的维护成本。列车到列车(Train to Train,T2T)通信在城市轨道交通中的应用有望解决CBTC系统中的问题,因此,本文重点研究了基于T2T通信的列车控制系统,并创新性地将深度强化学习应用到该系统中,使列车变得更加“智慧”。列车可以自主完成资源分配和列车控制,使整个系统具有更好的性能和更加灵活的运营方式,进而有助于城市轨道交通向智能化发展。本文的主要工作及创新点如下:(1)提出了一种基于T2T通信的新型列控系统,该列控系统采用了LTE-M(Long Term Evolution for Metro,LTE-M)系统。然而,在这个新型列控系统中,列车到轨旁(Train to Wayside,T2W)通信和T2T通信共存,导致频率资源紧张。为了充分利用有限的频谱资源,频率复用是一种有效的技术,但它不可避免地带来了同频干扰问题,从而影响了T2T和T2W用户的服务质量(Quality of Service,Qo S)。因此,本文提出了一种基于多智能体深度强化学习(Multi-agent Deep Reinforcement Learning,MADRL)的算法,该算法用于T2T通信中列车对信道和传输功率的自主选择,以减少同频干扰。具体而言,每辆列车的发射端视为一个智能体,智能体通过与环境的交互,独立选择动作,实现分布式资源分配机制。仿真结果表明了该算法的优越性:与随机分配方案和现有的T2T通信资源分配方案相比,所提算法大大提高了系统吞吐量和T2T链路信息传输成功的概率。(2)在所提的新型列控系统中,为实现更加灵活的列车运营方式,采用了列车协同编队技术。针对列车协同编队中的列车控制问题,本文采用了基于预探索的深度Q学习算法来实现列车的自主控制,打破了传统CBTC系统中需要对列车进行集中控制的限制。其中预探索的加入不仅加快了所提算法的收敛速度,还提高了算法的训练效果。此外,考虑到乘客乘车体验,本文对所提算法进行了改进,具体而言采取了两个优化措施:一是当列车达到控制目标后将算法输出的加速度大小强制性设为零;二是对算法中的状态和奖励函数进行了改进。仿真结果表明,优化后的方案在列车控制过程中,具有更加平滑的加速度变化曲线,因此可以提高乘客乘车的舒适度。而且,所提算法在两车或三车追踪场景下均能很好地完成列车控制任务,满足列车协同编队系统的控制需求。最后,本文指出了所做工作中存在的不足以及如何对这些不足之处进行改进。

其他文献

醋酸纤维素基聚离子液体膜的制备及性能研究

随着工业化发展的不断深入,环境污染问题也愈发严重,尤其是水资源污染。石油资源的泄漏、含油废水以及染料废水的大肆排放,不仅对水生生物的生存造成极大影响,还严重威胁着人

学位

醋酸纤维素聚离子液体吸附抗菌油水分离

副溶血弧菌qPCR检测及T6SS-1效应因子的筛选和功能研究

副溶血弧菌(Vibrio parahaemolyticus,Vp)和霍乱弧菌(Vibrio cholerae,Vc)均属于革兰氏阴性菌,是引起食源性胃肠炎或败血症的重要病原体。它们广泛分布于河口、沿海水域及沉

学位

副溶血弧菌T6SS-1双重荧光定量PCR分泌蛋白缺失株

彩色马蹄莲ZeLCYB基因的克隆与功能研究

彩色马蹄莲为天南星科马蹄莲属(Zantedeschia)多年生草本植物,因其具有色彩丰富的马蹄形佛焰苞而得名。其颜色艳丽,形态高雅,深受人们喜爱。但与其他植物相比,马蹄莲的栽培技

学位

彩色马蹄莲苞片色素分布与含量ZeLCYB遗传转化

季铵化腰果酚合成及抗菌性能研究

腰果酚,一种廉价的可再生资源,因其分子为一个间位十五个碳的烯烃取代的苯酚结构,而易于转变为多种工业原料而得到研究人员的广泛关注。我们以低成本丰富的可再生资源腰果酚

学位

腰果酚阳离子表面活性剂单壁碳纳米管壳聚糖抗菌性能

不动点与变分包含问题的研究

本文在Hilbert空间中,提出了一种逼近Lipschitz伪压缩映射不动点的迭代算法,这个迭代算法的构造,克服了Mann算法不一定收敛于Lipschitz伪压缩映射不动点的问题,并且在恰当的

学位

Lipschitz伪压缩映射不动点迭代算法拟变分包含拟伪压缩算子分裂变分包含

基于时空网格自适应的气体动理学格式研究

气体动理学格式(GKS)是一种基于介观气体动理论的新型CFD方法,在高速粘性流动中兼具高精度与强稳健性。本文将GKS与非结构网格自适应(AMR)及时间自适应技术相结合,发展了一种

学位

气体动理学格式时空网格自适应四叉树/八叉树非结构网格激波与SF6球体相互作用

反硝化电活性菌的微量热分析与分离研究

目前,解决环境污染问题与探索新能源是人们关注的两大焦点问题。微生物燃料电池(MFC)提供了一种处理污水的新技术,可以在脱氮除硫的同时回收电能。微生物在废水污染物的去除中扮演着重要的角色,反硝化电活性菌的活性不仅是硝氮去除效率的影响因素,还是反硝化除硫MFC性能的限制因素。本研究通过微量热试验分析不同阴极电势下反硝化电活性菌的生长特性与代谢活性。采用基于恒电位的稀释倍数法从反硝化除硫MFC中分离反硝

学位

微生物燃料电池反硝化电活性菌微量热技术分离pH

交际翻译理论视角下的历史类文本的翻译

本文是基于笔者的翻译实践完成的。翻译实践原文来自于Agricult in the United States:a documentary history,作者韦恩·拉斯姆森,曾就职于美国农业部。该书内容详实,从不同

学位

交际翻译历史类文本翻译策略词汇句子

道德判断中意图和结果信息加工的外语效应研究

随着国际间合作的加强,外语交流逐渐成为常态,由此引发了一个重要的问题,即人们在外语语境下的决策模式是否与在母语语境下有所不同。已有研究表明,人们在外语语境下会倾向于做出更功利的决策,具体表现为在母语语境下进行道德判断的决策时,人们更注重施事者的意图,而在外语语境下则更重视相应行为造成的结果。然而也有研究并未发现上述这种因母语与外语语境不同所导致的差异。为了解决上述争议,本研究聚焦道德判断中的外语效

学位

外语效应道德判断意图结果

纳米电催化剂的调控策略及其电催化性能探究

化石能源的不可再生性和人类社会对其的巨大消耗,使其不断走向枯竭。同时,传统化石燃料的燃烧造成的二氧化碳等温室气体的过度排放的环境问题,也使得廉价、清洁、可再生能源

学位

纳米材料电催化能源水分解二氧化碳电还原

深度强化学习在基于车车通信的列控系统中的应用

与本文相关的学术论文