【摘 要】
:
关系三元组的抽取,也称为实体和关系联合抽取,是一种重要的自然语言处理任务,在知识图谱的构建等方面具有重要的应用。关系三元组抽取的提出是为了从海量文本数据中提取出实体对和实体对对应的关系。然而实体和关系联合抽取任务是十分复杂的,因为关系三元组的类型是不确定的,重叠关系三元组在语料中是广泛存在的,重叠关系三元组组成复杂,因此重叠关系三元组的抽取工作一直是关系三元组抽取任务的难点。关系三元组的抽取任务可
论文部分内容阅读
关系三元组的抽取,也称为实体和关系联合抽取,是一种重要的自然语言处理任务,在知识图谱的构建等方面具有重要的应用。关系三元组抽取的提出是为了从海量文本数据中提取出实体对和实体对对应的关系。然而实体和关系联合抽取任务是十分复杂的,因为关系三元组的类型是不确定的,重叠关系三元组在语料中是广泛存在的,重叠关系三元组组成复杂,因此重叠关系三元组的抽取工作一直是关系三元组抽取任务的难点。关系三元组的抽取任务可以分为两个子任务,即命名实体识别和关系分类。传统的方法,比如pipeline方法,先进行命名实体识别,再根据实体识别的结果进行关系分类,因此如果命名实体识别错误必将会导致关系分类的错误,这样就会导致错误传播问题。近些年来,为了解决错误传播问题,大多数工作都是联合抽取模型,即实体和关系同时编码和解码。但是命名实体识别和关系分类这两个子任务是相互促进和相互帮助的,因此两个子任务之间的交互对于关系三元组抽取任务是十分必要的。而当前大部分工作没有考虑两个子任务之间的交互信息,或者只考虑了两者之间单方向的交互信息,也就是说两个子任务之间的交互没有被充分建模。实体对之间的短语的语义通常是可以反应实体对之间的关系的,而当前很多工作也都忽略了这一点。针对以上两个问题,本文提出了一种包含双向交互信息和实体对之间语义特征的端到端的实体关系联合抽取模型。在模型的句子编码模块,通过引入双向循环神经网络(Bi-LSTM)、句法解析树和图卷积网络(Graph Convolutional Network,GCN)来捕捉实体对之间的语义特征。通过引入交互层,双向地考虑命名实体识别和关系分类两个子任务之间的交互性。最后在模型的解码层,得到当前句子中包含重叠关系三元组在内的所有的关系三元组。为了进一步提升模型对于关系三元组的抽取能力,本文还提出了两种模型的改进策略。一种改进策略是从模型的结构上进行改进,另一种改进策略是从多任务学习的角度进行模型的改进。本文在两个实体关系联合抽取领域的公开数据集上进行了相关的实验,实验结果表明本文所提出的方法对比现有主流模型均取得了较优的抽取效果,同时也验证了两个改进策略的有效性。
其他文献
近年来,无线通信领域发展迅猛,各种新型技术应运而生。随着研究的不断深入,如何提高频谱资源利用效率以及如何提高信号检测的准确度成为通信领域的关键问题之一。索引调制(Index Modulation,IM)技术因其能够传输额外信息比特而不需要消耗能量和增加通信链路,受到学术界和工业界广泛关注。另一方面,多输入多输出(Multiple-Input Multiple-Output,MIMO)技术可以极大地
深度图像作为场景中三维信息的隐式建模,对于室内场景的研究有着不可或缺的重要性。它包含在给定视角,三维场景中物体表面与拍摄相机的距离信息。目前获取深度图像的方法是主要是通过带有深度相机的传感器拍摄得到,但是由于室内拍摄环境和设备硬件的因素,采集得到的深度图像往往会出现大量的噪声和错误点。并且,由于不同光照的影响,重构的深度图像也存在着大量不一致的问题。本文针对目前存在的问题,对室内深度图像的错误点移
电力行业在国民经济发展中占据重要的地位,目前,电力系统的规模日益扩大,在提高供电可靠性与经济效益的同时,也增加了大停电事故的风险。近些年来,全球范围内发生过多起大停电事故,给社会造成了巨大损失。研究发现,大停电事故大多由一系列的连锁性故障所致。因此,探讨连锁故障发生机理,建立兼顾真实性与快速性的连锁故障仿真模型,高效且准确地识别连锁故障发生与发展过程中的关键线路,从而制定相应的连锁故障防范措施,对
气体绝缘金属封闭开关设备(gas insulated metal-enclosed switchgear,GIS)具有可靠性高、受外界环境因素影响小、检修维护方便、结构紧凑、安装周期短、配置灵活、可扩展性强等优点,特别适合大城市场地拥挤地区的变电站、地下变电站,以及山区地势险峻的水电站。盆式绝缘子是GIS的关键部件,而盆式绝缘子中心导体与环氧绝缘交界面是盆式绝缘子最为复杂的部分,应力集中现象明显,
平板热管作为高热流密度散热装置,被广泛应用在各种电子设备中。随着电子元器件的高度集成化发展,平板热管的厚度不断减小。平板热管的超薄化影响到工质的相变流动和传热性能。因此探究超薄平板热管内部工质相变流动规律和最佳工作状态是当下刻不容缓的课题。本文以丝网芯超薄平板热管为研究对象,通过理论数值分析和可视化实验对其进行系统且深入的研究。基于流体相变传热传质理论,建立超薄平板热管各部分传热传质模型。结果表明
软件逆向工程领域中存在许多关于结构复现的分析方法,能够根据软件系统的某些产物复现出软件模型。这些分析方法根据是否需要运行软件系统可分为静态分析方法和动态分析方法两大类:静态分析方法不需要运行软件系统,而是通过对软件系统的源代码进行分析;动态分析方法则要求运行软件系统,对软件系统运行过程中的相关运行信息进行分析。目前重构出软件结构模型的分析方法都属于静态分析方法,它们需要对软件系统的源代码进行分析,
数据安全治理目前仍存在管理体系、共享制度、安全意识等方面不足,在数据安全战略的指导下,应通过数据治理来确保数据处于有效、合法的状态;再通过建设数据安全治理等相关组织,制定数据安全相关制度规范,构建数据安全技术体系,建设数据安全人才队伍梯队等措施,以期完善全生命周期的数据安全治理体系,充分保护关键信息数据,保证数据合理合法安全使用。
甘油单酯脂肪酶(MGL)是一种具有特异底物选择性的脂肪酶,可专一地水解甘油酯底物。MGL是生物体内功能调节的关键酶,参与神经信号传导、癌症的发生及抗炎响应等。开展MGL结构功能关系的研究可为深入理解其生理功能提供基础。同时微生物来源的MGL具有工业应用前景,在食品油脂改性、药物合成、生物化工等领域具有广阔的应用价值。不断进行新型MGL的发掘、结构功能及理性改造研究,以满足工业应用的需求。本课题以来
双连续相(bicontinuous phase)是指体系中两种组分所形成的相区各自连续又相互穿插的相态。一方面,双连续相的形成对于材料的宏观性能(如力学性质等)有着显著的影响;另一方面,从双连续相出发,可以通过选择性刻蚀得到具有连续孔道的多孔材料。由于这类多孔材料其具有三维贯通、高比表面积等特点,在过滤、分离、催化剂负载等领域有着重要的应用价值。嵌段共聚物(block copolymers)由两种
随着社会经济发展,当前对于移动机器人的需求不断被提出,且机器人也不断往智能化方向发展。双轮平衡机器人体积小、运行灵活,在室内空间展现了独特的优势。双轮机器人自身不稳定性的特点,使其运动控制变得不易,因此当前对于双轮机器人定位建图的研究也较少。针对上述情形,本文研究了基于模糊算法的双轮机器人控制系统,并且在平稳运行的基础上设计了同步定位与建图算法。本文具体工作如下:首先,对双轮机器人的整体框架使用分