【摘 要】
:
安全永远是轨道交通运输的重要主题。轨道交通通常是指国家铁路系统、城际轨道交通和城市轨道交通。保证轨道交通运输安全需要工作人员对列车和铁轨做日常监测、定期检测和维护。为此,积累了大量相关的非结构化文本数据。目前,对于非结构化文本数据往往采取省略、替换或删除的策略。由于非结构化文本数据相对结构化数据的信息更加抽象,不能直接被计算机处理,因此开发难度大。随着机器学习方法的进步,非结构化文本数据在自然语言
论文部分内容阅读
安全永远是轨道交通运输的重要主题。轨道交通通常是指国家铁路系统、城际轨道交通和城市轨道交通。保证轨道交通运输安全需要工作人员对列车和铁轨做日常监测、定期检测和维护。为此,积累了大量相关的非结构化文本数据。目前,对于非结构化文本数据往往采取省略、替换或删除的策略。由于非结构化文本数据相对结构化数据的信息更加抽象,不能直接被计算机处理,因此开发难度大。随着机器学习方法的进步,非结构化文本数据在自然语言处理领域得到发展,一些将非结构化文本数据转化成结构化数据的方法被提出。同时,轨道交通信息化要求的提出让轨道交通非结构化文本数据开发得到重视,迫切需要有效方法对报告或记录等形式的非结构化文本数据进行挖掘,提取出有效信息,从而进一步构建致因模型或事故模型对轨道交通安全进行风险分析。因此,本文主要针对轨道交通的非结构化文本数据进行研究,提出了一种基于网络的方法对文本进行关键词提取,进而识别出事故致因文本,实现事故的致因分析和风险分析,满足轨道交通信息化和智能化的发展需求。本文主要内容和创新点如下:1.基于复杂网络的关键词提取方法。为了帮助轨道交通相关人员从大量的事故/故障文本中获得关键内容,考虑到现有的基于网络理论的关键字提取方法仅考虑文档中词语之间的联系,而忽略句子影响,本文提出了一种新的网络模型NWS(New Word-Sentence),构建了由词网和句网组成的双层文本网络,该网络考虑了文本中句子对词语的影响。实验结果证明NWS方法提取出的关键词准确率、召回率和F值都优于经典TF-IDF(Term Frequency-Inverse Document Frequency)方法、传统的MF(the Most Frequent)方法和同样基于网络的Word-net方法和Text Rank方法,其中NWS的准确率、召回率和F值分别比Word-net方法高7.95%、8.27%和6.54%,NWS平均准确率也比TF-IDF方法的结果高17.56%。2.利用关键词提取的轨道交通事故致因文本识别方法。为能够准确地从轨道交通文本数据中识别轨道交通事故的致因文本以进行之后的致因分析和风险分析,提出了基于NWS关键词提取的致因文本识别方法。该方法首先使用NWS方法获得原因文本的特征,结合文本预处理过程,生成与致因文本有关的用户词典和停用词表来实现致因文本的识别。为验证该方法的有效性,通过改变方法中不同条件构成实验组与所提出方法进行效果对比。实验结果表明,致因文本识别方法在考虑关键词特征、停用词功能和文本相似度的条件下,识别效果最好,得到的准确率、召回率和F值最高。单就准确率来说,与其他实验差值最高达到8.72%。实验验证,本文通过对北京市地铁事故报告进行致因文本的识别,完成构建bow-tie模型,最后提出相应的预防措施。3.面向文本数据的动态贝叶斯网络事故风险分析。本文提出了一种基于文本数据的贝叶斯网络构造方法,即从事故文本中识别出致因文本,并根据文本特征和词语关联实现了故障树的构建。基于文本数据建立的故障树以及图模型,最后得到的贝叶斯网络对事故进行风险分析。实验数据选自美国联邦铁路局2008年—2018年列车脱轨文本数据集,本文提出的方法识别出事故的致因文本,从致因文本中提取出致因关系构建故障树,从而进一步获得相应贝叶斯网络的先验概率以及得到贝叶斯网络顶层事故发生的概率结果,计算出列车发生脱轨事故的概率为2.24E-04。4.基于地铁文本数据的致因链风险分析方法。本文使用网络爬虫技术获得2006-2020年“北京地铁”发布在微博平台上的地铁运营数据,结合本文已提出的关键词提取方法和致因文本识别方法,考虑地铁线路因素等有效信息对致因网络的影响,构建致因双层网络。该网络由致因网络和文本句网络共同构成,其中致因网络的节点是识别出的致因文本,文本句网络的节点是记录每条事故故障的句子。由于该双层网络具有文本属性,能够计算得到致因节点的综合特征值,将其作为致因节点的危险值。对致因网络采用相继故障方法得到事故最大可能致因链后,将致因节点的危险值代入公式中计算出各个致因因素和致因链的风险值。结果表明,风险最大的致因链为C9→D4,风险值达到27.717,它表示由于拥堵造成地铁设备故障引发事故的风险大,能够演变成较大事故,比如造成电梯损坏事故,因此应当及时地疏导地铁站内人流量。
其他文献
作为公共场所社会活动的主体,行人的安全问题是社会安全管理和智能安防建设的研究重点与热点。铁路综合视频监控系统现已覆盖客运站点的重要区域,为监控中心提供清晰的视频资源,成为实时监控、异常预警和事后查证的重要依据。现行铁路综合视频监控系统的智能化程度较低,内容分析手段主要依靠人工观测。随着视频采集点数量的增多、监控强度的提升,客运站点监控视频的人为解读与决策容易出现纰漏和失误,难以应对潜在的众多突发异
多排桩作为一种有效的波屏障,在环境减隔振中已得到广泛应用。然而,考虑多排桩的周期特征,引入固体物理学中的周期理论研究排桩屏障的减振特性,却是近十多年的事。目前,关于周期波屏障的研究大多局限于单相土,对饱和土中周期波屏障的研究则很有限。而且,这些研究通常采用实频散分析方法,也忽略了材料的粘性。同时,为了简化分析,未考虑移动荷载特征对周期屏障减隔振性能的影响。然而,已有研究发现,材料粘性、移动荷载的频
碳纤维复合材料以其比模量高、比强度高、抗疲劳等优异性能,为解决轨道车辆轻量化问题提供了绝佳的选择。复合材料连接部位纤维不连续,应力集中问题凸显,损伤模式相互关联,是结构薄弱和失效容易发生的区域。对此区域进行失效模式和失效规律研究以及承载力和寿命分析对整体结构的评价至关重要。碳纤维复合材料结构常用的搭接接头由于偏心加载存在端部弯曲效应,对结构承载力产生不利影响。虽然T700级碳纤维复合材料在轨道车辆
高速铁路作为大运量、高时速、可持续发展的绿色交通运输方式,已成为国家关键基础设施和重要基础产业,对我国经济社会发展和国家安全起着不可替代的全局性支撑作用。可靠的车地移动通信系统是列车安全运营的重要保障,为高速列车提供移动通信业务支持。随着铁路移动通信新型业务需求不断涌现,如旅客宽带接入业务、列车多媒体调度、铁路物联网等新业务应用应运而生,铁路移动通信系统的容量需求和频谱短缺之间的矛盾愈加严重。如何
无砟轨道是我国高速铁路主要的轨道形式,其最长服役时间已超10年。现场建设、运营经验表明,高速铁路无砟轨道结构层间损伤问题突出,已成为影响轨道结构安全服役的薄弱环节。通过对层间损伤病害的调研可知,无砟轨道层间损伤的工程表征和发生机理较为复杂,既可能在结构浇筑后的早龄期就出现离缝问题,也会因经受温度、列车等长期循环荷载逐渐劣化开裂,其本质是随时间进程发生发展的经时损伤问题。现有研究大多关注无砟轨道层间
监控视频数据在公共安全、智慧交通、智能家居等领域具有重要的应用价值。面对其爆炸式的增长,如何实现有效信息提取与冗余信息去除是亟待解决的问题。视频浓缩技术试图通过提取监控视频中的管道(即目标运动形成的轨迹)并沿时间轴重新排列,最大化运动目标的信息保留率和最大化背景信息的约减率,以解决上述问题。一个完整的视频浓缩流程,包含前景提取、管道构造、管道重排与管道缝合等关键步骤。然而,上述流程主要存在着四个待
新型城镇化重塑了城市空间格局,也深刻影响了城市居民日常交通出行。不仅如此,在其推动下,新的移民不断流向城市,流动范围扩大、流动过程复杂,城际出行行为模式也产生了新的变化。多年来,道路客运凭借灵活、廉价等优势承接着为新型城镇化衍生的交通需求提供运输服务的任务。但随着高铁和私人轿车的快速发展,道路客运面临着多重冲击。因此探索道路客运高质量转型发展是构建健康、高效综合立体交通网的基本要求,而研究旅客出行
临近空间高超声速飞行器面临严重的气动加热,由于发汗冷却热防护方案具有可重复使用且维持飞行器气动外形的优越性,逐渐成为高超声速领域关注的焦点。在发汗冷却热防护系统中,发汗冷却材料作为冷却剂传输与换热的载体,其性能直接影响着发汗冷却系统的可靠性与稳定性。目前,发汗冷却系统仍存在很多问题,如由于发汗冷却材料密度高,易氧化和孔隙结构不均匀等缺点导致的发汗冷却系统质量大,可靠性低。针对此问题,本文开展了对密
压电半导体是一种具有力-电-载流子多场耦合效应的功能材料。由于兼具压电性和半导体的特性,压电半导体材料可以用于制作传感器、晶体管、谐振器等元器件。这些应用的功能开发和性能优化需要我们对压电半导体材料的动态特性有深入的了解,尤其是压电半导体结构中弹性波的传播特性。层状结构是各类压电半导体器件的基本构形,且压电和半导体场的相互作用会对其中弹性波的传播特性产生显著的影响。因此,本文对压电半导体层状结构中
在实际运营中,部分地铁车辆转向架构架在运行里程远不及设计寿命时就开始出现疲劳破坏问题,这是因为我国地铁车辆运行条件复杂、工况多变且载客量大、维护不足等客观因素导致的。这些特殊性致使国际现行转向架构架设计标准不能覆盖我国地铁车辆转向架构架的实际设计需求。因此,编制可以反映我国真实运营情况的转向架构架载荷谱对地铁车辆的设计与运营安全至关重要。本文主要以某B型地铁动车转向架构架作为研究对象,对地铁车辆转