基于文本数据的列控车载设备辅助维护方法研究

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:WSFLTS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乍载设备作为中国列车运行控制系统的核心装备之一,其重要性不言而喻。在实际运营中,列控车载设备故障频率仍然较高,现有的依靠维护人员经验进行车载设备故障诊断的方式效率低,诊断时间长,直接影响行车效率,甚至危及行车安全。因此,铁路运营部门迫切需要探索能够提高车载设备故障诊断效率的辅助维护方法。现场记录的故障现象描述文本(以下简称“故障文本”)中隐含了大量和故障类别相关的信息。对故障文本进行表示,构建“故障文本-故障类别”的故障文本分类系统,可有效辅助车载维护人员进行故障诊断,对提高故障诊断效率具有重要的意义。然而,车载设备故障文本具有长度短,缺乏明确统一的记录格式,不同故障类别文本数目差别大的特点,使得传统的词袋模型特征表示方法和分类算法不能适用于车载设备故障文本分类器的构建。针对上述问题,本文提出了一种融合词特征和主题特征的故障文本特征提取方法,在此基础上,构建了基于代价敏感支持向量机的故障文本分类系统。具体工作如下:(1)基于信息增益提取故障文本的词特征。首先使用词袋模型进行文本表示,针对文本词袋模型表示维度高,包含大量无关特征的问题,本文提出了一种基于信息增益的故障文本词特征提取方法,对文本词袋模型表示进行特征提取,保留与分类任务相关的特征,得到故障文本的词特征表示;(2)针对词袋模型在短文本特征表示上的不足,本文提出了一种基于多粒度Latent Dirichlet Allocation(LDA)模型的主题特征提取方法,通过将文本特征从词空间映射到主题空间的方式,对故障文本的词袋模型表示进行特征扩展。针对LDA模型对主题数目敏感,主题数目在实际应用中难以确定的问题,同时为了更好地提取故障文本的主题特征,本文首先使用困惑度指标对不同主题个数的LDA主题特征空间进行选择,得到一组不同主题个数的LDA主题特征空间集合;在此基础上,提出了一种基于改进相关统计量Relief(Relevant Features)的主题特征空间融合算法,对主题特征空间集合上的各个主题特征进行融合,得到故障文本的多粒度主题特征;(3)通过使用串行特征融合策略对故障文本的词特征和多粒度主题特征进行融合得到故障文本的特征向量表示;(4)针对故障文本类别分布不均衡,造成少数类样本分类效果差的问题,本文提出了一种基于代价敏感支持向量机的故障文本分类模型构建方法。通过调整支持向量机训练过程中不同类别样本误分类代价的方式,提高少数类样本数据误分类代价,降低多数类样本数据误分类代价,使得支持向量机在不同类别样本上代价敏感,从而改善分类器在少数类样本上的分类准确度。最后,本文将提出的特征提取和基于代价敏感支持向量机的分类器构建方法与传统的方法进行了对比实验。相比于传统的词袋模型特征表示方法,本文提出的特征提取方法可有效地弥补词袋模型在短文本特征表示上的不足,提高文本分类精度;同时,相比于传统的分类器,基于代价敏感支持向量机构建的分类器可有效改善故障文本少数类上的分类准确度。实验结果表明本文提出的故障文本分类模型可有效辅助维护人员进行车载设备故障诊断,提高车载设备故障诊断效率。
其他文献
当前水资源短缺问题日益突出,非常规水资源的利用受到越来越多的重视。本文对宜兴市某小学已初步建成的雨灰水综合利用系统进行了优化设计,并开展了雨灰水处理系统的运行效果
碳纳米材料由于良好的导电性、高比表面积和低廉的成本已经被广泛应用于电化学储能领域。由于电极材料在根本上决定了储能器件的性能,因此研发具有理想性质的电极材料成为了
准脆性材料的强度等物理特性与试件尺寸以及加载率有关。目前对II型能量型尺寸效应与应变率效应还没有统一性的实验研究,且物理本质还没有解释清楚。本文利用霍普金森压杆系
目的:探讨细胞外基质金属蛋白酶诱导因子(Extracellular matrixmetalloproteinase inducer,EMMPRIN) 与基质金属蛋白酶 (Matrixmetalloproteinases,MMPs)2、 9及金属蛋白酶组
由于基金净值计算的时效性和要求精确性,其净值计算和会计处理是我国在会计核算中运用市场公允价值估值最为广泛和准确的领域之一。其中,具有代表性的为权证定价模型(Black-S
应用心率变异性分析法评价运动对人心脏自主神经功能的影响(摘要)研究生姚焰导师陈兆銮,任国钧(昆明医学院第一附属医院心内科,昆明650032)关键词心率变异性自主神经运动中图分类号R540心率变
随着现代计算机技术的不断发展和完善,尤其互联网信息技术的高速发展,公司各项生产经营活动的管理方式也随之不断发生变化,要求实现信息化管理,实现管理精细化,提高企业核心
对随机表面及其标定的研究在材料生长、工件加工和光学元件制造等科研技术的许多领域中有着重要的理论意义和应用价值。近场光学是研究距离物体表面一个波长以内(即近场区域)
线粒体中的丝氨酸蛋白酶LON/PIM1执行管家功能和调节功能;在高温、缺氧、损伤等应激情况下,LON蛋白酶对细胞的凋亡调控起着重要的作用。 本研究尝试使用RNAi的方法来减少
<正>人工智能是一门综合了大数据、机器学习以及各类感知智能等的跨学科、跨领域技术,未来将会给各行各业带来巨大的变革。预计随着人工智能的深入发展和应用,金融业将在三个