基于图卷积网络的文档级别关系抽取研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:abcdefg1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术的发展,各种数据爆炸式增长。新闻、报刊等非结构化的长文本中含有大量有价值的信息,如何自动地抽取出这些信息成为了一个亟待解决的问题。文档级别关系抽取作为信息抽取的关键任务之一,旨在抽取长文本中众多实体之间的句内和跨句关系。本文针对文档级别关系抽取任务进行了以下研究:(1)基于上下文语义的文档级别关系抽取探究文档级别上下文语义抽取方法,及其对文档级别关系抽取性能的影响。首先,以实体为节点,构建实体交互图。然后,分别基于三种图卷积网络,对上下文语义进行编码,捕获实体相关的文档级信息,进行关系抽取。在Doc RED数据集上的实验表明,基于实体交互图,采用图卷积网络,能够有效地捕获长文本中的上下文语义信息,建模实体之间的复杂交互关系,利用多头注意力机制和稠密连接技术可以进一步提升文档级别关系抽取模型的性能。(2)基于全局上下文增强的文档级别关系抽取实体对所在的句子包含了实体对相关的局部信息,而整个文档蕴含了实体对的全局信息。提出全局上下文增强的文档级别关系抽取方法。首先,构建实体交互图。然后,利用注意力机制和门控机制,融合实体所在的全部句子信息,获得实体感知的边表示。进一步,利用层次的图卷积推理网络分别捕获丰富的实体局部信息和全局信息。最后,融合两部分信息,获得实体表示,用于推理文档级别实体关系。在Doc RED数据集上的实验表明,实体感知的边表示能够将实体相关的上下文信息融入到节点表示中,层次的图卷积推理网络可以捕获丰富的局部信息和全局信息,获得高质量的文档级别关系推理模型。(3)融合推理路径的文档级别关系抽取实体对间的路径蕴含了丰富的关系推理信息,可以给文档级别关系抽取提供显式的推理指导。首先,获取实体交互图中实体间的路径,基于节点表示、边表示等信息,构造节点对的多条路径。然后,基于注意力机制,融合多条路径,获得实体对的路径表示,辅助推理实体关系。在Doc RED数据集上的实验表明,基于注意力机制的推理路径表示学习方法,能够捕获实体对相关的推理信息。在实体表示的基础上,引入推理路径表示,能够有效地提高文档级别关系抽取性能。本文的研究在文档级别关系抽取任务上取得了先进的性能。实体交互图可以有效地建模实体之间的复杂交互关系;全局上下文增强的关系抽取方法可以捕获丰富的局部和全局信息,获得高质量的文档级别关系推理模型;融合推理路径的关系抽取方法引入实体对的推理路径表示,进一步提高了文档级别关系抽取性能。
其他文献
超疏水微柱阵列具有特殊的水滴润湿性,能够应用于机翼防结冰、船舶航行减阻等领域,但其制备工艺仍存在制备成本高、制备设备要求高、工艺通用性低等不足之处,使得通用的变直径超疏水微柱阵列制备工艺相较于平整超疏水表面构建工艺更加难以运用于工程实践中,难以大规模推广。针对以上问题,本文提出了一种使用弯月面约束电化学3D打印方法制备变直径金属柱的制备工艺,在单次工艺中直接构建跨尺度的柱结构与柱阵列,实现宏微一体
随着科学技术的进步以及经济水平的提高,监控摄像机已经深入到社会各个角落,对社会稳定做出了巨大贡献。然而,数以万计的监控摄像机每天会产生不计其数的视频图像数据,并且监控视频中包含异常行为的片段或许不到万分之一,单靠人工的观察识别会浪费大量的时间,也容易遗漏重要的信息。如果计算机能自动识别出视频中每个人的行为,并对异常行为发出警报,将会节省大量的人力物力。因此,视频中的异常行为识别技术具有重要的研究意
现代安全防护领域多采用基于云计算的人工视频监控方法,在监测低概率出现的异常目标时,监控系统易出现由于视频信息冗余导致网络资源浪费、数据传输存在延迟以及人为失误导致检测质量下降等问题。边缘计算通过在网络边缘端对前端采集数据进行实时分析运算,可以有效减轻云端负载压力,提高系统响应实时性。同时随着深度学习技术尤其是目标检测算法迅猛发展,使得视频监控更加高效智能,有效缓解人工视频监控方法存在的缺陷。因此,
随着移动互联网的飞速发展,定位技术的进步,下一个位置预测已经成为了一项重要研究任务,这对于用户和商家具有重要意义。然而由于用户签到数据的稀疏性、相关特征的复杂关联,下一个位置预测存在巨大挑战。首先,现有下一个位置预测算法缺乏针对某一位置的具体行为模式分析,导致无法充分建模用户的历史行为模式及短距离出行模式。其次,现有模型使用的地理空间特征通常不包含公共交通特征,导致无法有效建模用户长距离出行模式。
幸福是指人类主观上产生的愉悦情绪。它是情感中的积极部分,影响着人们的生活质量。因此,理解人类幸福感是一项有意义的工作。本文主要讨论幸福感的两个方面(Agency/Sociality)。为了拓宽人们对幸福感的感知情况,本文在英文数据集Happy DB和中文数据集Weibo DB上分别对幸福感展开研究。为了分析幸福感的Agency和Sociality方面,在Happy DB数据集上,本文提出了一种基于
小样本图像分类是指从几个简单的例子中学习视觉概念。人类能通过视觉中心充分利用几个样本的特征信息,也能在学习过程中学会学习。本文以元学习为基础,从特征提取和学会学习两个方面提高小样本分类的准确率。为了在小样本图像分类过程中能充分利用图像通道和空间特征的位置信息,本文提出特征交叉注意力方法,该方法首先沿着通道和空间维度全局池化生成特征信息,然后通道和空间特征分别与原有特征交叉使得具有相似特征的位置互相
车辆重识别是指给定具体车辆在特定区域内的一张图像,根据车辆外观信息和部分辅助信息,检索出在不同摄像头下捕捉的同一车辆。车辆重识别技术是智慧交通建设的核心技术之一,对交通监管、道路安全、刑侦破案以及智能交通系统建设意义重大。随着深度学习的快速发展,车辆重识别技术近年来取得了重大进展,但车辆重识别仍面临如何解决类间相似度高和类内差异性大的挑战。深度网络推理加速是指利用有效的网络压缩方法对目前密集的深度
如今无人机已经在各个领域发挥着不可替代的作用,而目标跟踪任务对于无人机来说又是一项极为重要的功能,例如民用无人机的移动跟拍功能、消防无人机用来跟踪山火的走势功能等等。所以能够研发出有效的适用于无人机应用场景的目标跟踪算法显得尤为重要。以往的单目标跟踪算法大致分为两类,一类是传统方法,例如基于相关滤波的单目标跟踪算法;另一类是深度学习的方法,例如基于孪生神经网络的单目标跟踪算法、基于可见光和红外的融
在自然语言处理领域中,嵌入技术是一种将文本表示为计算机易于处理的形式的技术。但是,大多数的嵌入模型,无论是词级别,还是句级或者文档级的模型,其关注范围仅限一个文档之内,最多关注到上下句或者不同段落之间的关系,并没有利用文档间的相关性信息,这限制了模型对于文档级别文本的表示能力。最近出现了一种利用引用信息这种文档间信息进行嵌入的模型,该模型为了利用文档间的相关信息,并不直接将这些相关信息随着文档一同
目的探讨重组人源胶原蛋白局部应用对绝经后阴道壁组织病理学的影响。方法选取绝经后盆腔脏器脱垂需行手术治疗的患者50例,随机分为对照组25例和实验组25例。对照组术前不使用激素类药物和非激素类润滑剂或保湿剂;实验组于术前阴道内给予重组人源胶原蛋白均匀涂抹,隔天1次,每次2 g,术前至少使用10次。术中留取阴道前壁组织标本。用HE染色法观察阴道壁上皮厚度,Masson染色法观察阴道壁肌肉和胶原纤维的分布