事件的触发词与论元联合抽取方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zhongxinghai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息量的爆炸式增长,如何充分利用这些具备海量、多样、低价值密度特性的信息,来为社会、经济、技术的进一步发展提供推动力,成为了摆在研究者面前的一个重大的挑战。为解决这一问题,以从非结构化文本中抽取出人们关心的结构化信息为目标的信息抽取技术愈发重要,而事件抽取正是信息抽取领域的重要研究任务之一。事件抽取的目标是从非结构化的文本中提取出半结构化的事件,来直接运用或者服务于下游的研究和应用。事件抽取可进一步细分为两个子任务,第一个子任务为对文本中最能代表事件发生的字段进行抽取,该字段被称为触发词;第二个子任务为对参与事件的人物、时间、物品等要素进行抽取,这些要素被称为论元。事件抽取的成果对于文本摘要、问答系统、知识图谱构建等应用均具有十分重要的意义。以事件抽取为研究主题,本文的主要研究内容如下:首先,研究了事件触发词的抽取,该子任务又可称为事件检测。现有的事件检测方法仅仅将文本对应的实体类别信息作为文本信息的辅助,忽略了实体类别序列中可能蕴含的序列特征。本文提出了一个事件检测模型ETEED,充分挖掘实体类别的序列特征,并设计了一个触发词-实体交互关系学习模块,将文本序列特征与实体序列特征进行融合,提升了触发词抽取的效果。其次,研究了事件触发词与论元的联合抽取方法。目前大多数事件抽取研究都将论元抽取和触发词抽取分成两个相对独立的抽取阶段,即先对触发词抽取模型进行训练和应用,然后将触发词抽取的结果作为输入,传输到论元抽取的模型之中。此类事件抽取研究方法被称为流水线方法。这类方法优点在于模型的设计和训练相对简单,缺点在于触发词抽取结果的错误会在论元抽取模型中传播,且分阶段的训练会增大事件抽取任务的时间成本。因此,本文采用联合学习思路,通过共享实体类别信息的方式将触发词抽取和论元抽取模块进行连接,并融合预训练语言模型BERT的优势,构建了联合抽取模型PJEE,提高了事件触发词与论元抽取效果和效率。最后,本文就上述事件检测模型ETEED与事件联合抽取模型PJEE的效果进行了实验验证。在ACE 2005这一公开测评数据集上进行的大量实验表明,本文提出的事件检测模型和事件联合抽取模型能够有效地利用实体类别信息,并在各项评测指标上优于现有的事件检测和事件抽取方法。
其他文献
21世纪以前,费马、Baker、Pocklington、Brown、J.H.E.Cohn、张明志和李德勋等人解决了当|k|≤100时,不定方程x~4+kx~2y~2+y~4=z~2只有平凡解的情况.本文旨在解决当100≤|k|≤3
新世纪以来,中国特色社会主义进入新的时代,习近平总书记表示:“人民对美好生活的需要日益广泛,不仅对物质文化生活提出了更高要求,而且在民主、法治、公平、正义、安全、环境等方面的要求日益增长。”1这也表明了精神文明建设的迫切性以及国家对社会整体公平正义的重视。公共图书馆服务是我国精神文明建设的重要内容,其服务是否均等影响着社会整体的公平和正义。加强公共图书馆服务均等化的建设,有利于保障公民的基本文化权
生化系统的多目标优化问题是近年来研究的一个热门课题,许多专家和学者都做出了卓有成效的工作。在实际的优化问题当中,我们要考虑的目标不止一个,而是两个或者多个。通常情况下
Banach压缩映象是一类有着广泛实际背景的典型而且重要的非线性映射,人们在各种空间里面,不断的提出新的压缩映像,构造不同的迭代序列。在对参数的一定限制条件下,讨论各类压缩映
聚合物驱油技术成熟、成本低,在国内外陆上油田得到了广泛应用。但海上油田原油粘度高、剪切能力强、地层水矿化度高,常规线性聚合物难以满足在海上油田注聚条件下的增粘能力
本论文采用超快光谱技术分别对一种光致异构化分子和量子点的发光性质以及电子转移特性的过程展开了详细的研究。随着超短脉冲技术的迅速发展,研究者发现通过此项技术可以获得
随着科技与工业的快速发展,材料制备技术的要求也逐步提高,电流辅助烧结技术应运而生。电流辅助烧结是采用交流或直流脉冲大电流通过粉体实现快速烧结和致密化的工艺。相比于
新一轮工业革命带动着信息时代的发展,人们对于信息传输的需求不断增加,技术革命带来的新型产业对于集成化的要求也越来越高,随着元器件尺度的不断缩小,集成电路中结构的复杂程度也显著提升,此时电互联面临着种种局限,如延迟高、带宽小和信号干扰大等,硅基光电子学利用光信号作为新的传输媒介,发挥其高宽带、高传输效率和高抗干扰性等特点,成为集成电路领域新的研究热点。硅基光源作为硅基光电子学的重要组成部分一直以来受
图像实例分割问题在计算机视觉领域中担当重要的角色。随着深度学习技术的迅速发展,基于深度神经网络的强监督实例分割技术已经取得了显著的进展。为了降低强监督实例分割技术对于高成本像素级人工标注的依赖性,基于弱监督学习的实例分割技术研究也逐渐引起了研究者的关注。为此,本文以人体目标为例,采用基于深度学习技术的分割框架,展开弱监督实例分割技术的相关研究。具体研究工作及成果如下:(1)采用差分进化的PRM实例
我国是果蔬进出口大国,由于世界各国的地理位置和气候的不同,各国之间的果蔬种类差异化非常明显,果蔬差异会影响我国的果蔬进出口交易;此外,超市中果蔬的零售过程仍然采取人工称重的方式,浪费人力并且效率低下,严重影响顾客的购物体验。针对这些情况,本文提出了一种基于Mask Scoring R-CNN的果蔬检测与识别算法,能够实现果蔬检测、识别与分割等任务,该算法未来不仅可以用于移动端进行果蔬检测与科普,还