基于循环神经网络的关系抽取方法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户：yu351464325

【摘要】

：

随着互联网急剧发展,大量非结构文本数据日益增多,如何结构化这些文本数据成为一个亟待解决的问题,而自然语言处理任务的研究对象正是这些非结构化的数据。其中关系抽取是自

【作者】

：

孙俊

【出处】

：

河南大学

【发表日期】

：

2004年期

【关键词】

：

关系抽取长短时记忆网络卷积神经网络选择门辅助模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网急剧发展,大量非结构文本数据日益增多,如何结构化这些文本数据成为一个亟待解决的问题,而自然语言处理任务的研究对象正是这些非结构化的数据。其中关系抽取是自然语言处理任务中的一项重要基础任务。关系抽取任务是问答系统、知识图谱、信息检索等人工智能及其相关研究领域的基础任务之一。关系抽取任务通过获取句子中实体词之间的关系,从而能够自动化构建句子中存在的知识,便于研究者构建知识图谱。传统的关系抽取方式极为依赖人工经验,需要熟练且有相关知识的研究者手动选取特征,这样不仅导致特征选择效率低下,而且易出错。但是近年来随着深度学习的发展,更多的深度学习方法被应用于自然语言处理任务中,并且获得了很大的成功。但是这些使用深度学习方法的相关研究文献仍存在一些不足之处。针对具体存在的问题,本论文提出了三个基于深度学习的关系抽取模型,主要包含如下三个方面:(1)大多数关系抽取模型只使用了一种深度学习模型的,并不能将多种模型的优点集于一身,因此本文提出一种基于双通道自注意力的关系抽取模型,该模型通过使用卷积神经网络和循环神经网络分别提取数据特征,使模型能够有效利用两个网络模型的优点,弥补两个模型各自的不足。最后实验结果显示,本模型在Sem Eval-2010 Task8数据集上进行训练和测试,测试结果相比于其他使用该数据集的6个模型均有所提高,其综合评价指标F1值比其他方法高出1.4%至6.3%,达到了85.1%。(2)其他模型没有完全利用给出的实体词数据,因此本文添加了对实体词的运用,增加了对给出的实体词进行命名实体识别的过程,提出了一种基于辅助模型的关系抽取模型。该模型将实体识别任务作为实体关系抽取任务的辅助任务添加到模型训练中,从而进一步提高句子中的实体词对实体关系抽取任务的作用与影响。在模型使用和测试阶段则只使用主模型进行实体关系抽取任务模型,不再使用实体识别任务模型。实验结果显示,本模型在与上一个模型所使用的相同的数据集下,本模型得到的综合评价指标F1值比上一个模型提高了1.0%,达到了86.1%。(3)针对在模型中添加了实体词数据,但是无法通过有效的机制筛选数据中的有效信息,过滤无用信息这一问题,本文进一步提出了一种基于选择门网络的关系抽取模型。该模型加强了实体词和句子之间的联系,其中选择门结构能够有效获取实体词与上下文之间的重要关系,同时还能过滤句子中无效的信息数据,保留与句子语义及实体词与上下文有关联的数据。实验结果显示,本模型在Sem Eval-2010 Task8数据集上进行训练和测试,测试结果相比于其他使用该数据集的6个模型均有所提高,其综合评价指标F1值比其他方法高出2.8%至8.1%,达到了86.9%。

其他文献

农业银行LC分行“农银e管家”发展战略研究

伴随着互联网技术、智能手机的高速发展,电子商务发展日新月异,开始深刻影响着我国商业银行的各项业务,使商业银行面临巨大生存压力,也迎来了改革机遇。商业银行为了抓住机遇

学位

农业银行LC分行农银e管家发展战略

天水某大底盘双塔超限高层结构基于性能的抗震研究

大底盘双塔结构具有新颖的建筑造型和多样化的使用功能,能够满足业主的使用要求,体现设计师的设计个性,近年来在实际工程中得到越来越多的应用。但是此类建筑结构由于其受力极其复杂,在地震作用下的扭转效应较大,其破坏更加严重。以往的地震灾害也表明,复杂的超限高层建筑结构容易发生破坏甚至出现整体倒塌。所以研究其抗震性能,确保在不同地震作用下结构的安全性尤为重要。本论文选取天水某大底盘非对称双塔超限高层结构为研

学位

大底盘双塔结构超限高层基于性能弹性分析动力弹塑性分析

基于DELMIA的热冲压生产过程仿真与优化研究

冲压作为汽车生产的四大工艺之一,一直都是汽车制造厂家非常注重的生产环节。由于冲压生产环境的特殊性,需避免压力机与自动化设备的碰撞,使得人们对生产工艺规划的安全性及

学位

热冲压仿真轻量化模型优化系统开发

新型雾计算架构及其在遥感图像分类中的应用研究

众所周知,云计算自90年代末被提出以来,凭借着对延迟和网络抖动不敏感的大规模批处理业务适用的优势,很快成为了各行各业竞相争夺的科技制高点和财富宝地。然而,随着接入无线

学位

雾计算领导者选举算法负载均衡加权轮转算法在线遥感图像分类

双柏县大庄并网光伏发电站开发风险管理研究

近年来我国实行金太阳工程等一系列光伏补贴优惠政策,受政策影响,几年来我国的光伏发电项目呈爆炸式发展。截止2016年底,我国的光伏发电项目已累计装机77.42GW,这一时期是我

学位

光伏发电项目管理风险管理

旅游开发过程中失地农民的生计问题及应对策略研究

近年来,我国经济发展越来越快,旅游业的发展对土地的需求也越来越大,因旅游业发展而产生农民失地现象也越来越多。这些失地农民受年龄、受教育程度、生活习惯、就业等因素的

学位

失地农民生计资本配对样本T检验

KDP晶体油润滑辅助飞切加工表面形成机理及工艺研究

KDP晶体主要应用在惯性约束激光核聚变和固体激光器系统中,但KDP晶体具有脆性低、易潮解、各向异性和对温度敏感等特点,是世界上公认的典型难加工材料。目前主要使用单点金刚

学位

KDP晶体油润滑温度场表面形貌

基于课程学习和度量的面部表情识别方法研究

情感理解作为人机交互的基础,在服务机器人领域吸引了越来越广泛的关注。面部表情识别作为情感理解最直接的方式之一,目前仍然存在两个尚未解决的难题:其一,在大量样本训练下

学位

面部表情识别服务机器人课程学习少样本类内聚合损失

G糖业股份有限公司员工敬业度提升对策研究

在市场经济高速发展的背景下,人力资源的竞争显得尤为重要,引起越来越多企业的关注与重视。企业员工良好的工匠精神是企业内生发展的源泉,敬业度影响企业员工的工匠意识,成为企业评定员工工作行为与工作态度的重要标志。如何帮助企业在现有不断变化的市场中把握未来的发展方向,为企业建立一个具有高敬业的的人才队伍,是现有多数企业所面临的巨大问题和挑战,尤其是一些老旧国有制造生产企业的员工,面对经济下行所带来的企业效

学位

G糖业公司员工敬业度提升对策

太赫兹快速成像检测与图像处理研究

太赫兹成像技术作为新兴的成像技术,在安全检测、无损检测、生物医学领域有着重要的应用研究价值和技术发展前景。由于X射线电子能量较高,容易对被检测物质产生电离性伤害,因

学位

骨骼组织成像太赫兹成像技术太赫兹目标检测

基于循环神经网络的关系抽取方法研究

与本文相关的学术论文