面向煤矿事故领域的关系抽取研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:xrong19730911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
煤矿产业在我国经济发展中起到了中流砥柱的作用,对煤炭作为主业的能源企业来说,安全是生产之根、发展之本,安全的建设更是一项长期的、复杂的、多因素的、系统的工程。如何有效的控制风险、治理隐患,预防煤矿产业伤亡事故发生,找出其中存在的影响因素是关键点。以往的煤矿事故发生后会出现许多关于事故方面的存档信息,在这些信息中包含着许多有用的知识可以为以后的煤矿生产安全方面提供巨大帮助,但是这些未处理的经验案例杂乱无章,根本无法直接应用于未来的风险管理作业。虽然目前在煤矿事故分析领域已经有一些技术对煤矿安全工作进行研究,但是这些技术普遍都存在效率低下,落地效果不足等问题。面对领域数据增长的今天,利用人工智能方法将其应用到煤矿事故风险分析和预测变得越来越亟需。近年来随着“互联网+煤矿”的发展,利用知识图谱技术对煤矿事故进行有效分析是发展的趋势。对煤矿事故领域进行信息抽取是必不可少的步骤,而其中关系抽取技术是煤矿领域信息抽取中至关重要的技术之一。因此本文对煤矿事故领域实体关系抽取技术进行研究,重点研究采用基于注意力机制和预训练语言模型的方式从煤矿事故案例中获得煤矿事故本体的概念和概念间关系。主要研究内容和创新点如下:(1)首先针对目前关系抽取语义提取不够充分,未能同时综合考虑局部层面和全局层面因素的问题,提出了滑动窗口模型。模型由输入表征层、句子表征层、滑动窗口层、局部信息聚集层和分类层组成。其中句子表征层采用Sentence-BERT(SBERT)模型对句子进行充分的全局信息的提取,而滑动窗口层作为核心层,借鉴了CNN滑动窗口思想,采用滑动窗口机制序列化的捕捉任意部位的局部特征信息,充分的学习到句子的局部语言信息。因此本模型可以有效的提取到句子的全局信息和局部信息,解决了句子语义学习不充分的问题,大大提高了关系抽取任务的准确率。(2)其次为了支撑后期的煤矿领域关系抽取的研究工作,且目前煤矿事故领域尚未有现成的关系标注语料,构建了煤矿事故领域关系抽取语料集。本文对煤矿安全网、国家煤矿安全监察局、煤矿生产安全网、百度百科等网站发布的煤矿事故案例进行爬虫获取到原始煤矿事故文本,进行了删除无用信息等一系列预处理工作得到较为规范的煤矿事故案例数据集,进行分词分句实体标注,辅助同门完成了煤矿事故文本领域命名实体工作,在此基础上进行了煤矿事故文本领域的关系标注,构建了煤矿事故领域的关系标注语料集CMD(Coal Mine Dataset)。(3)最后针对煤矿事故领域关系标注语料集的长文本特性且目前的关系网络模型不适合进行长文本关系抽取等问题,设计了一种基于ALBERT预训练语言模型的长文本关系抽取方法ALBDRE(ALBERT-based Doc-level Relation Extract),其利用实体掩码机制显式地融合实体标签信息,为模型提高深层次的语义信息;且采用预训练语言模型ALBERT完成本模型的编码任务,增强了长文本语义特征的提取,从而实现了长篇章文本情况下的关系抽取。通过实验验证,对ALBDRE模型的可行性和有效性进行了验证,结果表明,本模型具有较好的关系抽取性能。
其他文献
随着科技的发展,使用数值模拟的方法对金属塑性变形及热处理进行研究倍受关注,各种模拟软件层出不穷。其中,DEFORM-3D是一种可以用来分析大多数热机械成形工艺,以及许多热处理工艺的模拟软件。一般的方法是在变形中定义初始工件的几何形状和材料,然后依次模拟将被应用到工件上的每个过程。然而,DEFORM-3D软件对微观组织的预测并不能达到用户的所有要求。但是,DEFORM-3D软件预留了二次开发接口,用
配流副是轴向柱塞泵的关键摩擦副之一,其润滑摩擦特性对轴向工作寿命、可靠性、效率十分重要。研究发现,配流副在工作过程中,配流副油膜呈楔形、配流副油膜最小厚度方位发生混合摩擦,配流副楔形角与方位角大小发生变化。配流副润滑摩擦特性与其楔形角与方位角息息相关,因此研究配流副的楔形角与方位角对指导配流副设计提高柱塞泵性能具有重要的意义。然而导致配流副楔形角与方位角大小的因素颇多,本文选择力士乐A10VO型斜
轴向柱塞泵的应用十分广泛,是液压系统中不可缺少的动力元件。配流副是轴向柱塞泵的关键摩擦副,由旋转缸体、固定配流盘和两者的间隙油膜组成。配流副的润滑状态会很大程度上影响轴向柱塞泵的工作效率和使用寿命。轴向柱塞泵配流副保持合适厚度的间隙油膜,能保障良好的润滑特性,有效提高泵的工作性能,延长泵的使用寿命。本论文主要的研究内容和结论如下:(1)以轴向柱塞泵配流副为研究对象,对其结构进行了介绍,并研究分析了
袋式除尘机作为一种高效的除尘设备,其除尘率高达99.9%,且在工业生产上得到了广泛应用。但其在长期运行过程中,会出现清灰能力下降,运行阻力过大,维护任务繁重等问题,不仅影响除尘效率,同时影响工业生产。其中常见的袋式除尘机故障包括,滤袋破损、储气罐漏气、脉冲阀漏气、排灰电机堵转等,因此除尘机工况监测系统对于除尘机保持高效除尘有着重要意义。目前的除尘机监测系统大都由上位机监控部分、通信部分和现场采集部
各类刑事案件、交通事故及建筑工地坠落等安全事故的频发导致人类胸部肋骨出现各种各样的骨折。针对肋骨骨折检测,传统医学影像分析是医生根据学到的理论知识与长期经验对图像内容进行解读诊断,繁琐耗时且漏诊率较高。随着机器视觉技术的快速发展,将卷积神经网络等深度学习方法应用于各种类型的缺陷检测任务已然是当下研究的热点。胸部CT肋骨骨折所特有的目标较小、形态复杂多样且与周围背景相似度较大等特点,使得实现胸部CT
飞机进气道消音板安装于发动机进气道前缘临近风扇叶片的位置,是飞机众多结构件中典型的隔振装置。处于高强度、周期性的振动工况下,进气道消音板常有开裂、脱层的状况发生,一旦发生上述状况会严重威胁到机组人员和乘客的安全。因此,对进气道消音板进行振动分析和结构优化以降低其发生故障的可能性对于工程实际具有重要意义。本文以三明治夹芯板等效理论对某机型进气道消音板的六边形蜂窝夹芯结构进行力学等效分析,推导出消音板
深海环境有着巨大的不确定性和复杂性,因此想要更好的研究海洋世界,就需要探索工具,也就是自主水下潜航器(AUV)。首先主要介绍了AUV发展及控制技术研究状况,查找相关文献资料,了解到当今自主式水下潜航器向着远程发展,向深海发展,向更加智能化方向发展。结合课题研究的目的和意义,本论文主要研究自主水下潜航器的深度和航向控制。首先,本文对自主水下潜航器结构设计以及对其数学模型分析。对自主水下潜航器总体结构
不定型耐火材料是近代冶金、建筑等领域中不可或缺的重要材料。不定型耐火浇注料不需要事先成型和经过高温煅烧处理,并且有着施工较为简单,生产效率高的特点,因此成为耐火材料不定型化的主要发展方向。通常由耐火骨料、粉料、结合剂和外加剂等组成的耐火浇注料,会根据使用环境和用途来调配,因此结合剂的选用起到了决定性作用。刚玉质浇注料通常以铝酸钙水泥作为结合剂使用,虽然有较高早期强度的优势但也存在中温强度低、养护工
随着科学技术的快速发展,云计算技术已经广泛用于个人及商业用途。云计算是通过互联网提供按需服务的最成功的技术之一。云计算以其超大规模、虚拟化、高可靠性、通用性、高可伸缩性和按需付费等优点为客户和企业带来了极为便捷的服务。但是,随着在线社交网络、科学工作流等内容共享和协同计算服务的发展,产生了大量的数据,史无前例的数据爆炸给传统的数据存储或处理技术带来了巨大的价值和挑战。云数据中心的容量并不是无限的,
低温共烧陶瓷(Low Temperature Co-fired Ceramic,LTCC)热切技术是对低温烧结陶瓷粉制成的生瓷带进行预热并切割成单品。因而,切割过程直接影响着LTCC最终产品的外形尺寸和后续装框工艺的精度及合格率。传统热切设备的切割过程操作复杂、自动化程度低,对此本文选题研究LTCC热切机的切割定位视觉系统及图像处理算法,以实现高精度的热切机自动定位切割。本文的研究工作及创新成果如