基于关系引导注意力网络的关系三元组抽取算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：zhanggang406

【摘要】

：

【作者】

：

杨毅

【机构】

：

重庆大学

【出处】

：

重庆大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的普及和大数据的快速发展,涌现了海量的文本数据,如何从这些杂乱、无结构的文本数据中提取出有价值的信息,引起了学者们的广泛关注。关系三元组抽取作为自然语言处理重要的任务之一,其目的是从无标注的文本数据中抽取出知识事实,对知识图谱的构建、文本摘要、智能问答、推荐系统等领域起着关键的作用。现已有大量的关系三元组抽取方法被提出并取得了很好的效果,但这些方法仍然有许多不足。基于这些方法,本文的主要工作和成果如下:（1）在单个文本句子中,可能会存在关系三元组重叠问题,也就是实体和关系可能会参与多个三元组的组成。并且本文还发现句子中可能存在隐式关系三元组,这种三元组的关系在句子中是语义不明显的,这会让抽取任务变得复杂困难。针对以上两个问题,本文提出了一种基于语义型关系引导注意力网络的关系三元组抽取方法（SRGA）。该方法先抽取出关系三元组的头实体,然后在所有预定义的关系下去寻找对应的尾实体。不同于过去的研究方法,该方法将关系看作一种先验知识而不是分类的标签。这种语义型关系可以当作引导,有助于识别出句子中的隐式关系三元组。考虑到在不同的关系下,句子中的每个词对于尾实体的识别发挥的作用不一样,这里使用了基于语义关系的注意力机制来获取细粒度句子表示。经过实验,表明该模型在两个公共数据集上的效果有着明显的提升。通过实验分析,说明了该方法可以有效解决针对的两个问题。（2）现存的关系三元组抽取方法都是一种单向抽取的模型框架,它们忽略了三元组抽取的双向性,这可能会导致模型的预测不够精确。并且由于关系三元组抽取任务的特殊性,其数据集中标注了大量的关系三元组,这对应着一种领域知识。引入知识到模型中可以提升模型的效果,但很少有方法考虑到这种知识。基于以上两个问题,文本提出了一种基于双向知识型关系引导注意力网络的关系三元组抽取方法（BKRGA）。该方法是一种基于多任务学习的双向抽取框架,其包含了正向抽取和反向抽取两个任务。这两个任务是并行且互补的,可以让模型抽取变得更精确。该方法利用知识嵌入算法Trans E去学习关系表示,从而引入了一种领域知识到模型中。并且还使用了基于知识型关系的注意力机制来获取不同的句子表示,用于引导相应实体的识别。通过实验和分析,本文所提出的模型在两个公共数据集上取得了最优的实验效果,并且验证了提出方法的有效性。

其他文献

面向智能网联汽车测试的关键场景提取与识别

数字孪生（Digital Twin,DT）技术从现实世界的驾驶数据中提取测试场景,被认为是智能网联汽车（Intelligent Connected Vehicle,ICV）道路测试的有效解决方案。如何从真实驾驶数据中提取并识别关键测试场景成为研究热点。本文以此问题展开研究,提出了新的DT测试场景选择方法。考虑了碰撞风险、交通因素,定义了三类典型应用场景——前向碰撞预警（Forwarding Col

学位

基于时空注意力图卷积网络的交通事故风险预测方法研究

交通事故风险预测是智能交通领域的重要研究课题,其预测准确度将直接影响道路交通安全水平。交通事故成因复杂,但均呈现出时间相关性和空间相关性,基于此展开研究,具有很好的理论和应用价值。本文在分析事故数据的时间相关性和空间相关性基础上,提出了一种基于时空注意力机制的交通事故风险预测方法,该方法融合空间距离特征和视觉相似特征以捕获交通事故数据高度动态的时空相关性。主要内容如下:（1）分析交通事故数据的时间

学位

图神经网络在人体骨架动作识别任务中的技术研究

动作识别作为计算机视觉中重要的组成部分,几十年来得到了广泛的研究。人体动作识别技术已广泛应用于智慧安防、人机交互、虚拟现实和机器人技术等领域。得益于骨架数据在动态环境和复杂背景下的鲁棒性,近来涌现了许多基于骨架数据的动作识别算法。受限于深度学习网络的结构,卷积神经网络（CNNs）适合处理网格式数据,循环神经网络（RNNs）擅长建模序列数据,而为非结构化数据而提出的图神经网络（GNNs）成为了处理骨

学位

面向大规模智慧城市的群车感知关键技术研究与实现

随着智能/辅助/自动驾驶技术的飞速发展,当前汽车配备大量传感器,拥有强大的感知、存储和通信能力,其中出租车、滴滴等智能网联汽车具有城市覆盖规模大和粒度细、以及可用的空闲时间充足等优点,从而为实现智慧城市大规模、细粒度、低成本的感知提供重要机会。因此,本文以智能网联汽车为研究对象,重点研究面向大规模智慧城市的群车感知（Vehicular Crowd-sensing）的三大核心关键问题,即如何激励汽车

学位

面向CNN专用加速器的深度学习编译器优化设计与实现

由于人工智能算法的迅速发展,卷积神经网络（Convolutional Neural Networks,CNN）模型通过专用硬件加速平台逐渐应用于嵌入式等环境,但是需要设计相应的深度学习编译器才能充分发挥出硬件的性能。目前国内对面向CNN专用加速器的深度学习编译器的研究还比较少,模型在部署方面还存在很多挑战。首先,随着CNN算法的发展,跨层次跳跃连接（Skip Connect）等复杂网络结构层出不穷

学位

基于策略迁移的高效强化学习算法与应用研究

近年来,强化学习算法已经广泛应用于实际应用中,解决决策与控制等复杂问题,如自动控制、电子游戏、机器人、智能电网和推荐系统等。但是,大多数强化学习方法从零知识状态开始训练一个智能体,需要庞大的数据、时间和计算资源。同时,在现实应用中,学习的计算成本随着任务的复杂度呈指数增加。因此,设计高效的强化学习算法,减少对数据及计算资源的依赖一直是强化学习中最具挑战性的问题之一。一种可行的方法是利用从相关任务中

学位

用于下一项推荐的时间感知兴趣模型的研究

近年来,人们对利用注意力机制从历史行为中获取用户兴趣的深度兴趣模型给予了广泛的关注。然而,目前大多数结合注意力机制的模型只考虑用户行为的顺序,忽略了用户历史行为的时间因素。对于下一项推荐任务,这里有以下三个观察结果:（1）用户的个性化兴趣与用户历史行为的时间因素有关;（2）用户的个性化兴趣是动态发展的,而不是静态的,一成不变的;（3）用户的短期兴趣在下一项预测/推荐中起重要作用。这些结果也与人们的

学位

基于结构信息指导网络的低剂量CT图像去噪算法研究

计算机断层成像（Computed Tomography,CT）具备快速生成高分辨率人体组织图像的特点,是医学诊断中广泛使用的一种成像方式。然而,过量的辐射暴露会增加患癌风险。虽然降低辐射剂量可极大限度地降低健康风险,但也会导致CT图像中存在过多噪声和伪影。因此,如何在低辐射剂量条件下获取高质量CT图像是一个具有重要意义的课题。近年来,卷积神经网络促使低剂量CT图像去噪研究取得了突破性进展,但相关研

学位

基于动态图卷积的交通流量预测算法研究

准确的交通流量预测能够为居民提供出行引导,帮助交管部门更加科学的管理道路网络,引导市政部门的道路建设,使人们的生活更加便利。然而交通流数据受到多种因素的影响,这些因素互相作用带来了交通流数据复杂的时空相关性,导致在对交通流数据建模的困难。针对交通流量预测问题,本文提出了两个基于动态图卷积和注意力机制的交通流量预测模型,并在Pe MSD4和Pe MSD8两个真实世界交通数据集上相对于11个不同的基准

学位

基于CBCT的虚拟牙合架系统研究

下颌运动是人完成咀嚼、吞咽、语言、表情等口腔功能活动的外在表现形式,一直以来都是口腔医学研究的重要领域。由于颞下颌关节、咀嚼肌群、牙齿咬合接触等需要协调工作才能保证下颌运动正常,在口腔治疗中,为了避免下颌运动与牙齿咬合失调,需要在术前进行准确的记录和模拟下颌运动轨迹。铰链轴在下颌运动中起到重要作用,是下颌运动中控制开闭口运动的转动轴,位于下颌髁突重心连线附近。现有方法采用机械牙合架描点标记的方式进

学位

基于关系引导注意力网络的关系三元组抽取算法研究

与本文相关的学术论文