基于深度学习的铁路设备事故数据挖掘与分析

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:stern_pea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过改革开放四十多年的接续努力,我国交通运输发展迅速。但进入新时代以来,我国交通运输行业到了爬坡过坎的关键时刻。交通运输发展不再一味的以扩大生产规模为中心,而是顺应新时代经济发展特点,重视运输生产基础领域的安全问题,通过融合高新技术探究安全事故规律,实现高质量发展的要求。我国围绕铁路安全已构建由“车机工电辆”五大专业系统组成的监控体系,各系运行产生了海量规模的安全数据,以语音、图像、报告等形式存储,各形式的安全数据中绝大多数都可以利用文本描述这种非结构化数据来代替表示,因此当前铁路系统安全领域信息的主要载体就是文本数据,且该载体存在多源头、异构性、大数据的特点。本文在此背景下研究美国铁路事故数据,挖掘铁路事故规律,依托深度学习技术对事故报告进行多源异构数据挖掘与分析。主要完成了以下研究内容:(1)针对铁路事故报告中的混杂数据问题,构建了基于字嵌入+BiLSTM+CRF的铁路事故文本命名实体识别模型。铁路事故报告中不仅记录了非结构化的文本序列数据,同时也混杂了大量数字、时间、地点等异构的关键信息。本文利用词向量生成的深度学习技术,从数据表达源头解决铁路事故文本输入序列结构性不同,难以统一提取的问题。该模型接收向量化的混杂数据表达后,通过双向LSTM层自动构造文本特征,切合了铁路事故术语构造复杂的特点,并结合CRF技术限制优化预测结果。根据实验分析,模型主要指标达到88%以上水准,可以有效识别铁路事故命名实体。(2)针对铁路事故类别分布不均衡的数据倾斜问题,构建了基于TextRCNN+Focal loss的铁路事故文本智能分类模型。在采集条件及分类规则难易度不等的情况下,铁路事故集中存在脱轨类别事故样本数量占比过大的特点,本文从算法层面进行优化,利用焦点损失函数代替交叉熵函数迭代,提高训练过程中难分类样本的权重。模型通过集成CNN和RNN的神经网络语言模型,契合了文本结构特点,根据对比实验分析,在各类数据集上能起到较好的分类效果。(3)基于前述工作,本文应用模型实例挖掘分析美国铁路设备事故的文本描述,数据集包含35年间近13万条大数据。实现了铁路事故信息提取、铁路事故频发地理位置分析、重点事故主题分析、铁路事故结构化数据统计分析、铁路事故原因分析、铁路事故可视化分析等应用,尝试了一种计算机辅助现场作业人员决策分析的方法。
其他文献
3D打印技术在食品中得到了广泛的应用,目前市场上多使用自身可印刷且可塑性强的单一食品原料(如巧克力、糖果等)进行打印。然而,还有一些不可自身打印的食品原料如肉类、面团等,其打印性能需要与多种食品材料混合来实现,所以强化混合材料的印刷性能对印刷适性的实现和后续加工有着重要的影响。因此,本论文以猪肉糜和大豆分离蛋白作为研究对象,联合使用超声波技术和菊粉改善双蛋白猪肉糜的流变特性,旨在获得一种适于3D打
低压差线性稳压器(LDO)作为片上系统(So C)中电源管理单元的一部分,对整个系统的性能起着至关重要的作用。数字低压差稳压器(DLDO)相对于模拟低压差稳压器具有低电压工作能力,对工艺,电压和温度变化不敏感,可以更容易的进行工艺升级,得到了更多的关注。传统的基于移位寄存器的DLDO瞬态响应速度较慢,可以通过提高采样时钟频率来提高瞬态响应速度,但是增加了DLDO系统的功耗,造成DLDO的瞬态响应速
人体在感染任何一型登革病毒(Dengue virus,DENV)通常只会引起较轻型的发热并能产生特定的终生抗体,大部分只有在感染异种血清型DENV才会导致登革出血热(Dengue hemorrhagic fever,DHF)和登革休克综合症(Dengue shock syndrome,DSS)。现如今,研发出抗DENV药物是疾病防治的主要措施。病毒的生命周期主要分为病毒感染的早期阶段、进入细胞后复
目的:随着生活习惯和工作方式的改变,非特异性下腰痛越来越年轻化,且发病率呈逐年递增的趋势。目前临床多采用传统康复训练、药物治疗、手术等治疗方式,效果针砭不一,本研究
组织内稳态是一个动态的过程,需要新细胞的产生来补充那些衰老和损伤的细胞,保持良好平衡。肠道作为新陈代谢最快的组织之一,当肠道损伤时,肠道干细胞可以通过持续增殖来补充
随着工农业生产的快速发展,不合理排放导致的环境问题越来越多,其中土壤重金属镉(Cd)污染问题日趋严重,已经威胁农产品的安全和人类的身体健康。因此,在不改变农田土壤种植属性的前提下,通过施加改良剂来降低土壤中Cd的生物有效性,进而降低作物对Cd的吸收,对于保障我国粮食安全生产具有重要意义。本文采用土壤培养试验的方法,研究牛粪与石灰配施对土壤Cd赋存形态的影响。试验中土壤Cd浓度为10 mg·kg-1
学位
学位
近年来,“核心素养”的培育已经成为了教育改革的趋势。我国在新一轮的课程改革中针对各个学科提出了具体的学科核心素养,旨在满足学生的终身发展需要。物理是一门以实验为基础的自然学科,实验教学在物理教学中占据着非常重要的地位,特别是分组实验的教学对于学生的各方面能力的培养至关重要。如何在高中物理分组实验的教学中培养学生的核心素养是一个值得重视与关注的问题。本文基于学生物理核心素养的培养,针对高中物理分组实
本试验选用二倍体水稻93-11和同源四倍体水稻93-11作为基础材料,通过测定发芽期及其幼苗期的生理生化的指标,对两者在发芽期和幼苗期两个阶段的耐盐性进行研究,并结合转录组测序技术,分析二倍体、四倍体93-11水稻在NaCl胁迫下基因表达的差异,在分子水平上揭示二倍体、四倍体水稻的耐盐机理和应对NaCl胁迫时水稻基因表达上的差异,为更好的利用四倍体水稻种质、耐盐基因发掘和水稻抗逆新品种选育提供基础