注意力增强包表示的远程监督关系抽取方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yuandatoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系抽取作为信息抽取技术的一项关键环节,在自动构建知识图谱、自然语言处理领域具有重要的理论意义和广阔的应用前景。为多种应用提供重要支持,主要表现在智能问答系统和智能化搜索场景中。其深厚的实用价值备受学界和业界的广泛关注,涌现出众多的理论成果和应用产品。远程监督关系抽取技术通过外部知识库作为监督源,自动标注语料数据,节省了人工标注成本,成为了关系抽取的研究热点。由于远程监督的强烈假设前提,导致回标语料中存在大量的噪声数据。因此,目前的研究重点主要集中在如何削弱噪声数据的消极影响上。本文基于Transformer预训练语言模型,提出了两种注意力增强包表示的远程监督关系抽取模型,以此缓解噪声的影响,具体如下:(1)提出了基于Transformer预训练语言模型和实体注意力机制的关系抽取模型DISTRE-EA。关系抽取任务意在识别两个实体所要表达的关系,所以实体表示的指导作用不可忽视。在发挥语言模型优势的基础上,用实体本身的信息指导注意力。通过计算实体表示与包内部每个句子之间的相关特性,深入挖掘二者的语义相似度,筛选预训练模型得到的句子嵌入表示信息,降低噪声句子影响的同时有助于优化包表示。相关实验数据表明:DISTRE-EA优于主流方法,有效验证了模型的抽取效果。(2)提出了基于Transformer预训练语言模型和句子级自注意力机制的关系抽取模型DISTRE-SA。由于包内部的句子嵌入表示是通过预训练模型分别获得的,彼此之间缺乏紧密的关联性。为了打破包内部互相独立的句子表示,我们在句子级别上使用自注意力技术。自注意力不仅可以捕获输入序列的相互依赖关系,并且多头注意力能够丰富不同表示子空间的隐含信息。使用自注意力对句子嵌入表示进行变换后,结合选择性注意力进一步增强了包表示。在NYT数据集的结果表明:DISTRE-SA相比原方法DISTRE具有较高的抽取准确率。
其他文献
阴离子交换膜燃料电池(AEMFC)凭借其电池性能好、成本低以及低渗透率的优点引起了科学家广泛的研究。而其关键部件阴离子交换膜的电导率不高、耐碱性差是目前阻碍其发展的两
本文是基于掘支锚机组配合设计的风幕除尘系统,该系统的特点是解决掘支锚机组双截割部产生的大量粉尘能被风幕阻隔,形成“透明式风墙”不影响司机人员的正常工作。并且在形成风幕的同时,双除尘风筒工作,能对掘进工作区的粉尘因负压作用集尘排出,实现除尘的效果。本文对掘支锚机组风幕除尘系统原理及掘进粉尘产生机理进行研究,针对掘支锚机组设计了风幕除尘系统结构。为了检验该设备在掘支锚机组断面粉尘除尘效果,通过研究粉尘
多壁碳纳米管(MWCNTs)具有高强度、高韧性、高模量、大长径比,耐高温的特点。MWCNTs在复合材料中极大的增强复合材料的力学特性、热稳定性并降低复合材料的可燃性。这些优良特性也是非石棉密封垫片所需要的。因此,本文将MWCNTs引入到无石棉密封垫片之中,研究新型纳米材料MWCNTs在无石棉密封垫片领域的应用。首先:根据前人的研究以及传统无石棉垫片材料性能特点,对MWCNTs无石棉垫片的组成材料进
船舶结构设计的目的是要保障船舶在使用周期内能够承受各种可能出现的载荷,结构强度设计是船体结构设计过程中的重要方面。传统的极限强度评估方法都是建立在一次性单调载荷下的极限强度的基础上,即认为船体的总体破坏是船体危险断面所能承受的一次性最为不利载荷组合的结果。事实上,在交变极值载荷作用下,船体梁的极限承载能力会随循环次数的增加而不断降低,基于一次性单调载荷下的极限强度评估方法可能会导致偏于危险的结果。
长周期光纤光栅(Long-period Gratings:LPFG)以其较小的插入损耗、带宽宽、后向反射低、对外界环境变化的反应灵敏度高、制作简单等可用于增益平坦器、带阻滤波器。随着光子器件领域的高速发展,尤其随着微纳光纤器件的发展,需要更加小巧、灵敏度更高、损耗更低的器件来满足在各种复杂环境下的稳定和有效工作。传统长周期光纤光栅制备方法包括紫外光刻写、飞秒激光/二氧化碳激光刻制、切纤熔接等,这些
煤炭作为中国的主要能源,其产量占世界总产量的近一半,煤炭的开采和洗煤过程中产生的煤矸石,是中国最大的工业废弃物之一,其长期露天堆放产生了环境和人身安全隐患。煤矸石具有废物和资源的双重属性,我国煤矸石资源化利用率远低于发达国家,为探究其应用于高等级沥青路面工程的可行性,本文研究了活化煤矸石粉与SBS复合改性沥青胶浆的路用性能和改性机理。(1)通过粒度分析、比表面积、扫描电镜(SEM)、孔结构等试验发
自从R.E.Moore系统的给出了区间数的运算理论以来,在众多学者的共同努力下,区间分析及其应用得到了很大的发展.区间值映射是取值为区间数的函数,是区间分析中的重要组成部分.
吸波材料指的是能够吸收或大幅减弱投射到其表面的电磁波能量,从而达到消除反射波、提高抗电磁干扰能力、模拟真空环境等目的的一类材料。吸收率和吸收带宽是吸波材料最为关
水是人类的生命之源,更是大自然所有生物赖以生存必不可少的物质。天津市作为全国严重缺水地区之一,有着人均水资源匮乏、地下水严重超采、水资源污染严重等突出问题。2017年
随着大数据时代的来临,社交网络等迅速发展并产生海量且关系复杂的网络数据且隐含很多重要且有价值的信息。面对海量数据,传统的邻接矩阵等向量表示形式存在向量稀疏、计算复杂度高的问题,而网络表示学习将海量数据转化为低维稠密的向量表示并将其作为常用的机器学习算法的输入进行网络分析任务,使得快速高效的进行网络分析成为可能,因此具有重要的研究意义。网络表示学习的核心思想是在保留网络的拓扑结构特征的基础上找到一个