面向铁路文本分类的字符级特征提取方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:anlisha521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
铁路文本分类对于我国铁路事业的发展具有重要的实用意义。现有的中文文本特征提取方法依赖于事先对文本的分词处理,然而面向铁路文本数据进行分词的准确率不高,导致铁路文本的特征提取存在语义理解不充分、特征获取不全面等局限性。针对以上问题,提出了一种字符级特征提取方法CLW2V(Character Level-Word2Vec),有效地解决了铁路文本中专业词汇丰富且复杂度高所导致的问题。与基于词汇特征的TF-IDF和Word2Vec方法相比,基于字符特征的CLW2V方法能够提取更为精细的文本特征,解决了传统方法依赖
其他文献
为探究巷道过断层破碎带时的安全控制技术,以1203运输顺槽为研究对象,分析研究了巷道破坏特征,设计采用以挖底方式和联合支护方式过断层,能够有效避免断层破碎带对巷道稳定性
为了提高超高水材料充填工艺的充填效率,优化设计了超高水材料制浆系统,并在店坪煤矿某工作面展开工程实践应用。结果表明,优化后的制浆系统能实现上料、输水及内外循环搅拌
图节点的低维嵌入在各种预测任务中是非常有用的,如蛋白质功能预测、内容推荐等。然而,多数方法不能自然推广到不可见节点。图采样聚合算法(Graph Sample and Aggregate,Grap
目的探究在原有分流系统基础上采用胸骨前切口接驳可调压抗重力阀治疗裂隙样脑室综合征(slit ventricle syndrome,SVS)的可行性和有效性。方法纳入<14岁脑积水分流术后出现裂
目的探讨尿激酶局部冲洗对慢性硬膜下血肿锥颅引流术后复发的影响。方法回顾性分析2013年1月至2018年12月经锥颅引流术治疗的慢性硬膜下血肿患者,分为尿激酶组(387例)和无尿
目的探讨高血压脑室出血引起认知功能障碍的危险因素。方法收集我院2016年12月到2019年12月高血压脑室出血病例,通过logistic回归分析影响高血压脑室出血后认知功能障碍发生
针对陕西彬长文家坡矿业有限公司4106工作面运输顺槽巷道变形严重问题,设计采用锚杆+金属网/塑钢网+W钢带+锚索联合支护方案。在顺槽内布置2个测站,监测结果表明:巷道围岩顶
为解决采煤工作面超前支护工序繁琐、劳动强度大、工作面推进慢、巷道变形严重等问题,以工作面运输巷为工程背景,现场调研对巷道围岩支护进行分析,采用工程类比法分析提出超
为解决淋水巷道顶板稳定性差的问题,以潞宁矿22116运输巷为工程背景,对淋水巷道顶板失稳原因及其控制技术展开研究。结果表明:巷道顶板在水侵蚀作用下弱化,支护的承载性能衰
针对海天煤业下分层工作面过超高平行空巷存在的片帮、冒顶隐患,采用速凝早强高水充填材料进行充填,3 d强度2 MPa,配合高速制浆系统,实现快速充填,解决了工期紧张问题。效果