面向不规则文本的篇章级事件抽取研究

来源 :辽宁科技大学 | 被引量 : 0次 | 上传用户:iceberg4ever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出使用知识图谱和基于机器阅读理解的面向不规则文本的篇章级事件抽取模型。数据稀疏和远程依赖是篇章级事件抽取研究中的两个重要挑战。本文对多个数据集进行处理,结合知识图谱技术,缓解数据稀疏问题给模型带来的负面影响。本文使用机器阅读理解模型,自动生成问答模板,在全文范围内寻找正确答案,解决部分远程依赖问题。本文提出再回答机制,将知识图谱中的信息嵌入到机器阅读理解模型中,实现篇章级事件抽取。与经典事件抽取模型相比,本文提出的模型取消事件和论元识别两个子任务,减小了误差传递。本文使用知识图谱缓解数据稀疏问题。首先,本文设计了一种新的数据结构,能够将语料中的事件信息存储到知识图谱中,同时保留事件与事件、事件与论元之间的位置关系。在存储节点中增加下级节点索引的功能,更方便顶层模型从知识库中获取事件间关系。其次,本文提出了基于条件概率的初始化方法。以篇章级文本为基本单位,计算事件同时出现的概率,生成事件链;计算某个事件论元出现的概率,生成论元链。最后,控制知识图谱中事件节点数量和事件论元数量,运行本文提出的模型,证明使用知识图谱能够部分解决数据稀疏问题。本文提出再回答机制,结合机器阅读理解模型,缓解远程关系依赖问题。首先,本文提出基于意图和事件链的文本表示方法。这种表示方法能够充分表示文本中任何位置的信息,增加机器阅读理解模型挖掘文本信息的深度。其次,模型根据知识图谱中事件链和论元链生成事件抽取问答模板,经过运算后产生抽取结果。再回答机制中,计算确认事件发生的情况下,发生事件链下一个事件的概率;针对不确定事件,抽取该事件对应论元链的所有论元,比较得到的论元数量和确定事件的已抽取论元数量的均值,确定是否生成不确定事件的问答抽取模板。在实验部分,基于ACE2005数据集生成的知识图谱,本文与领域内标准模型进行横向比较,论元分类的召回率R为40.8%,F1分数为42.26,证明了本文模型在缓解远距离依赖问题上的有效性。在本文生成的数据集上,选择30%,50%,70%,85%的数据存储至知识图谱,对应F1分数为47.37,49.89,50.62,51.06,证明本文模型在缓解数据稀疏问题上的有效性。
其他文献
学位
学位
学位
以环境友好的水-聚乙二醇(PEG-200)为反应介质,本文发展了一种绿色、可循环Pd(OAc)2催化烯烃与碘代芳烃交叉偶联反应的新方法.通过该方法可以获得一系列具有良好选择性和高收率的偶联产物.Pd(OAc)2-H2O-PEG-200体系可以直接回收并用于3次以上的循环而不失去反应活性,证明了整个无负载钯催化体系的稳定性.该方法降低了反应成本,操作简单,有利于工业化生产.
期刊
随着经济的发展,我国车辆的保有率逐年增高,随之而来的就是交通密度不断增大,进一步导致道路拥堵、事故频发。如何在有限的人力资源下,满足高负荷的交通管理需求是我们亟需解决的问题。在此需求下,许多学者在深度学习与计算机硬件发展的基础上开发了智慧交通与无人驾驶等解决方法。而车辆检测作为智慧交通与自动驾驶的一个重要检测方面,是研究热点之一。车辆检测是精准识别不同图片中的车辆的位置与类别信息,依赖着目标检测模
学位
学位
<正>角膜塑形镜(以下简称“OK镜”)作为青少年视力矫正以及近视防控的主要方式之一,受到了诸多家长的关注,但在实际验配中,家长们又存在很多疑问。疑问一:OK镜为什么这么贵?值不值得花高价为孩子验配呢?OK镜的验配价格由市场决定,从经济学原理看,供求关系决定产品价格,当“供不应求”时,产品价格普遍偏高,当“供过于求”时,产品价格就会回落甚至走低。
期刊
目的 比较高近附加设计多焦软性角膜接触镜(多焦软镜)和角膜塑形镜(OK镜)对近视儿童调节的影响。方法 纳入30例近视儿童,依次配戴单焦软性角膜接触镜(单焦软镜)、多焦软镜、OK镜。分别在不同矫正状态(OK镜矫正1个月后裸眼检查)测量角膜形态、3 D和6 D调节刺激下的调节反应及调节微波动。结果 在3 D、6 D调节刺激下,配戴多焦软镜产生的调节反应均低于单焦软镜(3 D,F=5.94,P<0.01
期刊
环形加热炉是轧钢生产操作中的重要设备。钢坯在加热炉中的加热质量不仅直接决定着最终产品的质量好坏,而且还会影响到下游轧机的正常运行以及故障率。因此,控制环形加热炉的炉温使钢坯按照目标温度进行升温,对于轧制生产的进行和节能降耗有着非常重要的意义。首先,本文以环形加热炉为研究对象,介绍其基本结构、生产工艺以及控制方法,指出生产过程中存在的问题,给出了所需加热钢坯的物理属性,并介绍了传热学的基本原理和三种
学位
近年来,医学大数据规模在迅速增长,不同医学实体对象、关联及其实体的属性信息构成了一个巨大的医学异构信息网络。以目前的医学水平,想要为每种疾病研究出专门的药物,比较困难。很多相似的疾病之间共用同一种药物,药物与其他相似药物的协同使用往往能够治疗不同的疾病。在医学异构信息网络中,利用深度神经网络和图神经网络可以将医学实体节点的拓扑结构信息和属性特征信息表示成更加精确的向量节点或更加简洁的子结构特征,通
学位