基于深度学习的实体关系抽取研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:baichuan817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的信息化时代,人们每天获取的信息大都来源于网络,但对用户有用的信息却分散在夹杂着噪声数据的网页中。因此,如何从海量的噪声数据中提取到对用户有用的数据受到更多专家学者的关注。而实体关系抽取任务的目标就是将文本中已经标注的实体进行关系提取,从而获得知识之间的关联。常用的实体关系抽取方法是使用单个神经网络进行特征提取,但该方法只能关注特征信息的某一方面,且性能不太稳定;再者最短依赖路径在实体关系抽取任务中已经取得一定的效果,但其只关注到句子中对实体间的关系有重要作用的成分,不能充分的获取到实体的上下文特征信息。本文围绕实体关系抽取研究中存在的上述两个问题开展了如下两方面的工作:1.针对单个神经网络只能关注到句子的某一方面特征,且在不同的输入条件下表现出不同结果的问题,提出一种基于集成学习方法的实体关系抽取模型。该模型利用集成学习的思想将两个弱分类器CNN和Bi-LSTM集成到MLP的强分类器中形成一个综合模型,该综合模型不仅可以充分利用CNN和Bi-LSTM分别对局部特征信息和全局特征信息高度关注的优势,而且可以利用MLP的自学习能力和自动分配权重的优势,提高关系分类性能。本模型在不添加其他额外特征信息的情况下取得的F1值为87.7%。2.最短依赖路径方法主要关注句子中对实体词有重要关系的成分,忽略了实体词的上下文特征信息,因此本文提出一种增强依赖路径的方法进行实体关系抽取研究。该方法主要利用Tree-LSTM为最短依赖路径上的单词构建其依赖子树,使后续模型不仅可以关注到对实体词有重要作用的单词,更可以为依赖路径上的单词提供其依赖子树,充分获得单词的上下文信息。与其他主流关系抽取模型相比,本模型取得了88.79%的效果。为将上述研究内容方便应用于实际场景中,本文设计开发了一个实体关系抽取的原型系统。
其他文献
滚动轴承是旋转机械的重要部件,由于机械部件集成度高,轴承故障监测系统的采样点和采样周期不断增加,处理大量数据的能力已经成为现代故障诊断方法的必要要求。传统的机器学习故障诊断模型为浅层网络结构,若模型输入特征表示不足,可能会导致误诊断。滚动轴承在高维数据下存在特征选取困难导致分类结果不准确问题,深度学习虽然能够自动从原始数据中学习基本特征,但标准的深度学习的方法只考虑了单一的深层次特征,忽略了浅层特
近年来,随着我国特高压电网投运的规模日益增大,人工巡检输电线路的方式已经无法适应我国电网发展的实际需求。目前,大部分地区输电线路巡检采用传统的人工巡检方式,该方式存在成本高、安全系数低及故障反馈时效性差等问题。另外,少部分地区采用无人机航拍巡检,该方式有效地弥补了人工巡检存在的一些缺陷和不足,但是就目前而言,无人机在远距离巡检方面还存在一些不足:一方面是电池续航问题;另一方面是与地面站通信距离问题
针对永磁同步电机无传感器技术设计了反电势观测器。对存在电流测量误差的情况下,提出了一种复合观测器设计方法。通过调节闭环系统中观测器参数,保证了所设计观测器的有效性。分析了存在测量误差环境下复合观测器的鲁棒性,并基于复合观测器在速度环PI调节器中搭建了模糊PI控制。论文具体研究工作如下:(1)为了得到电机的位置信号和速度信号设计了反电势观测器。根据电机实际数学模型构造电机参考模型,利用得到的误差信号
法医同一认定是一种法医通过对已知和未知客体的两个或多个特征之间的异同点进行比较和鉴别,推断出所研究客体是否来自同一客体的认识活动。该技术中较常采用的生物特征指标主要有人脸、指纹、掌纹、虹膜、牙齿、颅面形态和DNA等,但是在极端环境中,人脸、指纹、掌纹、虹膜等指标可能会受到诸如火灾、化学腐蚀或外部创伤等环境因素的制约,导致信息缺失,且环境和经济因素也常常限制大规模遇难者DNA的测定。因此,研究一种不
人工智能时代,无人驾驶汽车是汽车工业的研究热点,能大幅提高交通系统的安全性和效率性。在无人驾驶领域,图像信息采集和处理十分关键,直接影响无人驾驶系统对路面信息的判断。因此,图像的质量对无人驾驶汽车而言至关重要,然而其经常会受到天气(如雨、雾天气)等不定因素的影响而大打折扣。近年来,随着深度学习的兴起,智能交通(如机动车窗、监控镜头等)图像处理的重要理论和相关技术的研究成果已收获颇丰,能够较好的去除
近些年来,深度学习发展迅速,研究者开始利用卷积神经网络来进行目标跟踪。另外,随着无人机技术的飞速发展,现有的无人机产品具有操作简便和成本较低等优点,采用无人机进行视频目标跟踪已成为新的研究热点。比如在公共安全监控领域,与固定摄像头监控相比,无人机运动灵活,可以获得更加丰富的目标信息,从而更容易持续地锁定跟踪目标。然而,由于无人机飞行的姿态、飞行速度以及飞行高度的快速变化,在信息采集过程中会出现相机
机车发展至今它已经是现代运输网络和物流网络中必不可少的一环,在世界各国中铁路运输是重要的一环。自从我国开始“一带一路”的国际项目,我国的铁路机车因为其性能优越出口各国。但由于各国的铁路轨距有差别,我国在机车设计时要适应出口国家的标准要求。悬挂系统是机车的必不可缺的组成,它的参数选择是否合理对机车的运行起着重要作用。以往的研究中将机车悬挂系统进行简化研究,如一系悬挂简化为具有较大刚度的一个弹簧、其它
计算机和信息技术的飞速发展促进了三维模型在各个领域(包括制造业、娱乐业,甚至军事等领域)中的广泛应用,因而三维模型的数据安全及版权保护问题也受到了人们更多的关注。为了防止非法用户对三维模型数据的盗用以及对其内容的非法访问,本论文以秘密共享和数字水印技术为基础,深入研究了三维模型的数据特点,提出了基于秘密共享的三维模型共享算法和不可见三维模型盲水印算法,实现了三维模型数据及版权的安全保护。本文的主要
无线传感器网络是一种新型的信息获取和信息处理技术,可广泛应用于环境监测、目标跟踪、信息安全、智能医疗等领域。传感器节点一般通过电池供电,由于电池的能量有限并在恶劣环境下不能够及时更换,所以传感器的能量限制成为传感器网络持续运行的障碍。为了解决能量不足问题,研究人员主要从三个方面研究:一方面是设计低功耗路由协议,另一方面是进行能量收集,还有新兴的一方面是能量补给的充电规划研究。随着无线充电的快速发展
铜合金板带材主要应用于引线框架、通信、电力和电气和电连接器的多个领域。其中薄规格的带材其宽厚比可达46502,由于下游生产对成品铜带的表面质量、带材精度、残余应力以及板形的要求极高,所以对铜带的生产提出了巨大的挑战。目前某厂的成品铜带主要存在边浪、1/4浪、边裂、厚度不均匀以及残余应力大等亟待解决的问题。本文使用该厂六辊UCM轧机辊系参数,应用大型有限元分析软件ABAQUS,采用显示动力学,对六辊