基于深度学习的实体关系联合抽取研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:flyingship23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,数据量急速攀升,大量的数据无法得到充分利用,如何利用这些数据成为了自然语言处理领域研究的热点。这些数据中主要包含大量的自由文本,如何从这些自由文本中自动抽取出结构化信息成为了信息抽取的关键任务。目前有监督的实体关系抽取研究主要分为流水线的方法(Pipleline Method)和联合抽取的方法(Joint Method)。流水线方法将实体关系抽取视为两个独立的子任务,会产生误差传播和冗余实体的问题。为了解决这个问题,联合抽取方法被提出。尽管联合模型已经得到了很好的研究,但是大部分的工作都忽略了实体关系抽取中存在的三元组重叠问题。此外,目前的研究也缺乏三元组先验知识,在模型训练过程中添加三元组信息,可以有效的提高模型的泛化能力和性能。根据实体关系抽取的研究现状,本文从实体关系抽取中存在三元组重叠问题和缺乏三元组信息的问题出发,提出了两种实体关系抽取模型,分别解决以上两个问题,并分析了模型与目前研究的优点与不足。本文的主要工作具体如下:1.为了缓解实体关系抽取模型中普遍存在的三元组重叠问题,本文提出了一种基于BERT的级联双标记实体关系抽取模型。该模型采用联合抽取方法,并引入BERT预训练语言模型和指针网络(Pointer Network,PN),在考虑到了实体识别和关系分类两个子任务相关性的同时,避免了冗余实体对的产生,同时解决了三元组重叠问题。2.为了解决实体关系抽取模型中普遍缺乏三元组信息的问题,本文提出了一种基于三元组信息的异构图神经网络实体关系抽取模型,模型在解决三元组重叠问题的同时,加入了三元组信息进一步提高了模型的抽取性能,并引入了异构图神经网络(Heterogenous Graph Attention Networks,HGAN)来融合文本信息和三元组信息。在NYT和Web NLG两个数据集上的实验表明,三元组信息可以有效提高实体关系抽取的性能。
其他文献
图像因为直观、信息量丰富的特点,在现实生活中得到广泛应用。但在现实场景中,经常会出现弱光、逆光和不均匀光照的情况,在这种场景下获得的图像有低亮度、低对比度、狭窄的灰度范围特点,同时伴有噪声和失真的现象,也被称为低照度图像。这类图像不容易直观地获取信息,也对后续高级计算机任务精准完成产生一定阻碍。针对低照度图像增强任务,研究学者提出了众多算法,增强后图像质量在不断提高;但就如何改善低照度图像亮度和对
学位
<正>1952年,中国人民解放军步兵第99师295团在修建长春第一汽车制造厂后,脱下军装整体改制,一路辗转,最终扎根在四川省德阳市,成为今天的四川四建。前不久,笔者有幸参加了四川四建的建司70周年庆典,并借这个机缘看到很多珍贵的历史影像,又因为工作原因,特别留心了当时的安全防护用品,印象最深的是前辈们头顶的安全帽。尽管很多照片已十分模糊,但我们仍可以清楚地辨识出他们头顶上的藤条安全帽。据说,这种“
期刊
互联网技术的高速发展的今天,越来越多的人们学习、工作、生活在互联网上,这些行为通常以大数据的方式被各大公司记录并使用。然而,其中涉及到用户个人隐私数据的部分往往遭到滥用,甚至越来越多的用户个人隐私被泄露或贩卖,用户的个人安全遭遇前所未有的威胁。针对以上问题,本文开展了如下的工作:首先,分析总结当前个人隐私数据保护措施。当下,传统的针对个人隐私数据保护的方法一般是将数据存储到中心化的数据库或云上。此
学位
人脸表情识别(Facial Expression Recognition,FER)通过让机器智能理解人类行为已广泛应用于各个领域。随着FER的应用越来越广,许多的挑战也接踵而至。首当其冲的是来自表情显著区域,其纹理特征容易受到表情动荡变化的影响,从而导致特征鲁棒性不足。其次,在真实场景中,FER技术面临着人脸图像处于大姿态下的问题,会极大程度影响识别精度。除此之外,随着深度网络在真实场景中的应用越
学位
近年来,复述识别任务获得了前所未有的关注,其具体表现为判断两段文本之间是否存在复述关系。随着复述识别任务的研究深入,已在信息检索、抄袭检测、机器翻译、自动问答等领域取得广泛应用。目前,基于深度学习的复述识别模型已经取得一定的成果,而通过多方面特征提取和引入外部知识的方式增强文本语义,可进一步提升复述识别模型的性能。因此,本文开展了如下研究:1.本文提出了一种融合多粒度与多通道特征的复述识别模型,该
学位
智能手环,手表等设备的出现改变了现有的医疗系统,这些设备会收集用户健康数据,由专门的应用程序进行分析并给出对应的医疗建议。这种由移动监控设备提供医疗服务,称为移动医疗(Mobile healthcare,m Health)。m Health存在严重的安全和隐私风险,监控设备与智能手机通过蓝牙连接时,并不与特定的m Health应用程序进行绑定,恶意应用程序可能进行数据窃取、恶意数据注入攻击。区块链
学位
安全是煤炭工业生产中最重要的部分。现有针对煤矿的安全监测主要采用对传感器采集数值的硬性划分,关联信息分析及处理手段单一,缺乏对风险态势的智能化挖掘整体方案。如何提前发现煤矿风险,及早对煤矿事故进行预测是煤矿生产中需要解决的难点。本文针对单一事故和多类型事故等不同场景,利用麻雀搜索算法,结合增量极限学习机进行煤矿生产安全风险预测,并构建煤矿安全风险模型对煤矿生产安全进行态势评估,最后将其应用于煤矿安
学位
目的 分析医疗机构落实单病种质量管理政策面临的诸多挑战,提出单病种管理策略,形成管理经验。方法 构建单病种质量管理体系新模式,包括完善单病种管理组织架构与评价体系、搭建综合智能管理平台、优化业务流程与培训等。结果 单病种填报时长缩短,上报情况明显改善,病种诊疗的效率、质量、预后等指标显著提升。结论 新管理模式提升了单病种管理水平和诊疗能力,推动专科病种诊治同质化提升。
期刊
汽车涂装已成为汽车生产过程中的重要环节之一,其喷涂质量直接影响着汽车外观。汽车涂装的本质作用是提高车身的耐腐蚀性和耐候性,延长车身的使用寿命。目前我国汽车涂装工艺相较于传统工艺而言,正朝着简化工序、减少设备投资等成本费用、提高生产力等方面发展。涂装工艺历经多次变革,现已基本实现高度自动化,且汽车车身的使用寿命可以达到10年以上,但目前我国的涂装技术与欧美国家相比仍有较大的差距。本文重在介绍新型的涂
期刊
随着地铁路线结构逐渐复杂,客流量日益增加。如何缓解轨道线路拥挤,是智能交通系统中的核心问题。目前大量研究集中于道路交通,缺少对轨道站点流量变化模式的挖掘以及对于轨道线路流量的精确认知与评估,难以为轨道运营部门提供准确的客流信息与决策依据。针对以上问题,本文利用基于频谱周期性特征的交通模式挖掘方法以及统计方法、机器学习、深度学习等方法,展开对轨道流量交通模式和短时交通流量预测两个方面的研究。论文的主
学位