端到端的联合实体关系抽取的研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:woaiwojiaren5210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱作为一种结构化的信息,已被广泛应用于搜索引擎、问答系统等自然语言处理应用中。为了满足日益增加的世界知识,自然语言处理领域的研究者们致力于探索高效地自动获取世界知识的办法,那便是关系抽取技术。传统的关系抽取采用了管道式的抽取方法,首先识别出文本中的所有实体,再将实体两两组合,判别实体对所属的关系。管道式抽取方法忽略了命名实体识别和关系分类两个任务之间的紧密联系和相互作用,且实体识别的误差会传递给下游的关系分类任务,由此产生了端到端的联合实体关系抽取模型,命名实体识别任务和关系分类任务共享编码器和参数更新。近年来,前沿的端到端实体关系抽取模型致力于解决关系重叠问题,但仍然存在一些问题,如:1)主流文本编码器BERT将输入文本的最大长度限制为512,无法处理长文本的关系抽取;2)BERT内部基于Transformer的自注意力机制以及关系分类任务的解码器的复杂度与句子最大长度的平方成正比,导致模型庞大;3)很少公开发表的研究在中文关系抽取数据集上进行性能测试比较。基于以上问题,本文主要贡献如下:1)基于现有研究,提出了改进的端到端的实体关系抽取模型,主要改善了端到端模型的嵌入表示,降低了模型的复杂度,在英文公开数据集NYT上不仅提升了关系三元组的F1分数,还减少了模型的计算时间;2)提出了一个适合长文本的实体关系抽取模型。通过将一个长句文本切分成若干长度较短的子句后,构建了子句对的关系抽取模型,将长文本抽取问题转换为多个子句对之间的关系抽取问题,从而解决了长距离三元组无法被抽取的问题,也解决了长文本的模型空间复杂度过高的问题,并在中文数据集Du IE2.0的简单关系上验证了其有效性和并且相比较滑动窗口方法提升了关系F1分数;3)提出了一个复杂关系的抽取模型。模型通过将一个复杂关系抽取问题分解成多个简单关系三元组抽取的方式,从而能在一次抽取过程中抽取出更多与关系相关的属性,而不仅限于主体和客体。并在Du IE2.0的复杂关系数据集上验证了其有效性。
其他文献
为比较两种氟苯尼考注射液的药物代谢动力学,选择30只健康鸡随机分为两组,分别单剂量20 mg/kg bw肌内注射受试制剂和参比制剂,于给药后0.167、0.33、0.5、0.75、1、1.5、2、4、6、8、12、24、48 h翼下静脉采集血样。用超高效液相色谱法(UPLC-UV)测定血浆中氟苯尼考的含量,并用WinNonlin 8.1非房室模型计算主要药代动力学参数。结果显示,受试制剂和参比制剂
期刊
期刊
传统计算机中存储与计算分离的体系结构是形成“冯·诺依曼瓶颈”的根本原因,而大数据时代的到来使得这一问题日益突出。忆阻器(memristor)因其结构简单、尺寸可缩小性好、读写速度快、擦写耐受性高、具备多维存储能力等优点受到广泛关注。根据忆阻器的阻变特性以及基尔霍夫定律和欧姆定律,可以直接利用忆阻器的状态构建逻辑计算,这种状态逻辑实现了数据存储与计算在物理单元上的融合,是打破“冯·诺依曼瓶颈”的有效
学位
阐述轨道交通系统的特性,轨道交通安防系统的框架,包括同源架构平台集成、异构平台集成,探讨轨道交通智能安防运营的场景。
期刊
<正>随着新课程改革的持续深入,人们对教育的关注已经不再局限于对外在规模发展的重视,而是逐渐认识到教育教学质量的重要性,强调转变机械训练、填鸭式教学,促使学生能够在学习过程中真正获得新知识获取能力、问题分析解决能力以及合作交流能力。2021年教育部明确表示,作业管理是教育改革五项管理之一,同时针对作业做出了明确规定,强调教师与学校都必须充分展现作业的育人功能,减轻学生过重的学业负担。
期刊
流数据是一种具有快速产生、一次处理、不断变化和无限等特点的数据序列,这使得传统的数据挖掘手段难以适用于数据价值分析。挖掘流数据中潜在的数据分布,分析其演化规律,从而发现其中隐藏的数据价值成为了一个有待解决的问题。针对上述问题,本文以流数据为研究对象,对具有演化特性的流数据潜在的数据分布和演化规律进行了深入研究。本文的贡献主要包括以下三个方面:首先,针对现有的流数据聚类方法不能反映具有重复出现价值类
学位
Stack Overflow是广受欢迎的编程问答社区,每天有大量的用户在社区提出不同质量水平的问题。为了确保整个社区的质量,给用户带来良好的使用体验,问答社区需要及时关闭那些低质量的问题(如重复问题或不相关的问题)。社区授予主持人和有经验用户审阅问题质量的特权以关闭质量较差的问题。用户对问题的审阅过程是一项典型的众包工作,依赖于用户自愿参与:用户需要自发地浏览问题并对低质量的问题进行投票,如果票数
学位
空间目标监视雷达与地基精密跟踪成像雷达是外层空间信息感知的重要手段,相较于二维逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像,其对空间目标观测形成的三维ISAR图像能够更加真实地反映目标散射点的实际三维分布结构,在判别空间目标类型、分析目标重要结构、推断目标功能属性方面发挥着不可替代的作用。空间目标监视雷达在实际工作过程中同时承担了搜索、跟踪、定轨
学位
目前为止,视觉是人类感知世界的重要方式之一。事件相机是一种生物启发式的视觉传感器,其工作原理与传统相机截然不同。传统相机按照固定帧频率拍摄图像;事件相机捕捉像素级的亮度变化,其输出具有稀疏性和异步性。受益于其独特的工作方式,相比于传统相机,事件相机拥有高时间分辨率、低延迟、高动态范围、低能耗等诸多优点,在高速运动、光照条件较差以及工作平台资源有限等具有挑战的环境下更具有性能优势。在消费电子、工业自
学位
随着限制性条件下人脸识别技术研究的不断深入研究,这项技术也愈加趋向于成熟,且准确率颇高。然而在非限制性条件下,由于光照、表情、遮挡、姿态等外界因素的不可控,会导致人脸识别的性能下降,其中姿态变化由于会带来面部的刚性形变,影响人脸的对称性与完整性,是人脸识别中遇到的首要瓶颈所在。在此背景下,本文针对姿态变化导致的人脸识别准确率下降的问题,研究从单一姿态的人脸图像中生成多姿态人脸图像,并设计了基于注意
学位