基于文本信息抽取的高铁车载设备故障发现的理论与方法

来源 :北京交通大学 | 被引量 : 9次 | 上传用户:impeipeiyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
列车运行控制系统(简称列控系统,Chinese Train Control System,CTCS),由地面设备系统和车载设备系统构成,车载设备系统对高铁的运行起着至关重要的作用。车载计算机运行中形成的Log日志文件和工作人员撰写的交接班记录中包含着大量的、反映车载设备运行状态的信息,是车载设备故障发现和诊断的重要依据。然而对这两类文本数据的利用目前仍局限于工作人员人工记录、查询和解读,存在效率低、主观性强、缺乏理论指导意义等一系列问题。本文针对以上问题,通过对上述两类文本进行信息抽取和整理,建立了较为完备的故障字典;基于正则表达式方法,结合Matlab仿真,实现了 Log日志文件语句的自动定位,开发了车载设备故障发现的自动化处理平台;从而提高了工作人员交接班故障发现、记录和分析流程的工作效率;避免了以往人工处理的主观性;所构建的故障字典对故障发现和进一步研究具有指导意义。本文的工作主要有以下几个方面。首先,本文介绍了高铁车载设备的基本结构及本文研究需要的两类数据源,即:车载计算机Log日志文本及工作人员交接班记录文本;分析了两类文本文件的数据特点,总结了信息抽取算法等研究成果;采用数据挖掘工具WEKA与SQL Server数据库相结合的方式进行处理探索,发现了常规故障文本数据挖掘的问题。结合两类文本数据特点,确定了故障发现与自动定位的研究框架。其次,确定了最大匹配分词算法和TFIDF算法对工作人员交接班记录和Log日志文件进行信息抽取,构建了标准化的故障字典,并且针对Log文件非结构化的特点利用正则表达式算法实现了故障语句的自动定位。最后,利用Matlab编程实现了基于两类文本文件的故障自动发现与定位,搭建了适用于Windows系统的故障发现人机交互平台,并基于已有的Log日志文件对平台进行了实用性展示。
其他文献
本文以故障文本信息为依据,提出基于文本挖掘的高铁信号系统车载设备的故障诊断方法。针对故障追踪表记录的不规范性和随意性,采用主题模型对故障追踪表进行分析和特征提取;
【正】 1.概述随着我国工农业的不断发展,我国的森林资源状况日益匮乏,用材中的成熟林和过熟林蓄积濒于枯竭。大面积的种植速生材不仅能满足工农业的需求,同时也起到维护生态
执行力是具体行政行为的效力之一,它特指行政机关以生效具体行政行为为依据,以不履行前者所设定义务的行政相对人为执行对象,采取相应法定措施,强制执行对象履行相应义务的力
认真贯彻中央农村工作会议精神坚持办好管好农村合作基金会本刊评论员在最近召开的中央农村工作会议上,中央再一次明确:农村合作基金会要办成社区性的资金互助组织,不搞存贷业务
农业部门要认真学习宣传贯彻《会计法》农业部副部长万宝瑞八届人大常委会第五次会议通过了《关于修改(中华人民共和国会计法)的决定》。修改后的《会计法》,适应社会主义市场经
独角兽,一个兴起于资本市场的概念,正在搅动地方政府的一池春水。任职于南京某职能部门的程峰(化名)日前告诉中国证券报记者:“南京正意识到自己在独角兽领域的不足。”$$在程峰看
报纸
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为探索凹槽导叶式处理机匣与单级风扇的耦合机理,以单级升力风扇为对象,采用数值模拟方法对实壁机匣和处理机匣风扇进行对比研究。结果表明:引入处理机匣使风扇裕度提升11.11
中央提出的精准扶贫脱贫战略,是以全面建成小康社会为目标,对宏观大局进行谋划的战略性系统工程。全面有效,是精准扶贫的刚性标准。故不可将精准简单理解为精细,更不能将精准
[目的]比较椎间孔入路和椎板间入路经皮内窥镜椎间盘切除术治疗L5S1椎间盘突出症(LDH)的临床疗效。[方法]回顾性分析本院2014年12月~2016年12月49例接受经皮内窥镜手术治疗L5