基于深度学习的中文实体关系抽取关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:corber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的快速发展及人工智能技术的日益成熟,互联网环境下累积了海量文本数据,其具有海量、多源、异构等特点且蕴含了极其丰富的语义知识,因此对其进行抽取能够有效提炼具有潜在价值的结构化知识信息,从而实现文本信息结构化,因此本文重点关注如何从多源异构文本数据中有效抽取高质量、结构化三元组信息,该问题是信息抽取领域重要研究内容之一,具有重要的学术研究价值及工业应用价值。目前,信息抽取技术主要包括两部分,即命名实体识别(Name Entity Recognition,NER)和关系抽取(Relation Extraction,RE)。已有研究方法可大致分为以下几种:有监督信息抽取模型、半监督信息抽取模型、无监督信息抽取模型以及基于远程监督的信息抽取模型等。本文重点研究有监督信息抽取方法,即基于深度学习的中文实体关系信息抽取关键技术研究,主要研究工作如下:1、提出了一种基于命名实体识别+关系分类的实体关系抽取模型,该模型首先采用基于双向循环神经网络(Bi-LSTM)模型对文本语句中实体上下文语义信息建模,然后利用条件随机场(Conditional Random Field,CRF)对BIO(Begin-Intermediate-Other)标注集间依赖关系优化,最终利用卷积神经网络模型(Convolutional Neural Networks,CNN)抽取不同实体特征以实现对实体间关系的准确分类。2、提出了一种基于概率图的实体关系抽取模型,其主要基于从序列到序列(Sequence-to-Sequence,Seq2seq)的翻译模型进行信息抽取,即先利用上下文信息预测句子中主语S,然后利用已预测S信息直接预测与之对应的宾语O及关系P;3、提出了一种基于多头注意力(Multi-Head)机制的预训练语言(Bidirectional Encoder Representation from Transformers,BERT)联合实体关系抽取模型,该模型并行化的实现实体识别及关系抽取两个子任务,从而通过交互提升的方式有效解决同实体多关系问题;通过在真实信息抽取数据集上实验显示,本文构建的基于深度学习的中文信息抽取模型可有效提升实体关系三元组的抽取性能,较已有模型其性能具有较大提升。
其他文献
在超精密加工过程中机床状态、切削工艺参数、材料性能及刀具磨损等因素都可能对表面粗糙度造成较大的影响,而如何对加工工件表面粗糙度进行预测进而指导工业生产是先进制造技术研究重点方向。本文对国内外关于加工表面粗糙度预测方面的研究进行了回顾,并详细分析了加工表面粗糙度影响因素。根据超精密加工的特点及影响加工表面粗糙度因素,设计了超精密加工实验方案,搭建了加工过程中大数据采集平台,以加速度传感器采集机床主轴
柔性可穿戴产品是当前重大消费需求之一,但全柔性的电子技术仍处于初步研究阶段,相关器件的功能性和可靠性都不足以实现系统级的应用。鉴于硅基半导体技术的发展已能实现芯片的微型化,将印刷柔性电子技术与功能强大的硅基电子技术结合,实现兼具功能和轻薄柔性的电子系统,是柔性电子实用及发展的重要方向之一。本课题针对此方向,采用基于印刷电子的混合制造技术对基于蓝牙的柔性电路及其可穿戴传感器应用进行了实验研究。本文主
期刊
采用熔融共混法制备低密度聚乙烯/聚苯乙烯/马来酸酐接枝聚乙烯(LDPE/PS/PE-g-MAH)复合材料,并采用超临界CO2釜式发泡法制备了发泡材料,研究了超临界CO2浸润时间、发泡压力、发泡温度对复合材料发泡行为的影响。利用DSC、流变仪、SEM等仪器对复合材料及其发泡材料进行表征。研究结果表明,LDPE/PS的熔点为112.7℃,LDPE/PS/PE-g-MAH的熔点为110.8℃,PE-g-
随着无线通信的快速发展,4G通信已经大规模普及并且逐步向5G通信过渡。手机作为移动终端设备的一部分,在日常生活中起着越来越重要的作用。由于当前的手机具有高屏占比、超薄化和全网通等特点,这就需要手机天线在更加小的空间内满足更多频段的覆盖。另外,为了更好地满足5G通信的需求,多天线技术也被广泛地使用在天线设计中。基于此,本文重点对手机天线进行研究与设计,主要研究工作如下:首先,本论文利用耦合馈电技术设
我今天想就罪刑法定原则及其司法化中的法律解释等问题,同大家进行讨论和交流。可以这么说,我们对"罪刑法定"这个主题是情有独钟的,它是一个独具魅力的话题。1997年,我国修订刑法第一次规定了罪刑法定
期刊
随着自由曲面镜片的迅速推广和广泛应用,眼镜市场亟需建立一个合理的评价标准来帮助消费者判断镜片成像质量,本文提出了基于哈特曼原理的检测方法,对自由曲面镜片屈光度、波前像差、光学畸变进行测量与研究,通过对以上三个光学参数的理论分析及实验分析来共同评价自由曲面镜片的成像质量,其主要研究内容如下:(1)分析屈光度及其检测方法,搭建屈光度测量系统,基于哈特曼原理对不同自由曲面镜片的相同有效区域进行检测,再通
在产品开发的流程中,来自用户域的客户需求决定了产品定位,是关乎产品成功与否的最初环节。随着制造业生产力水平的快速发展,客户需求呈现出变化速度快、个性化程度高、表达形式多样的特点,传统的客户需求研究方法由于效率低、人工干预度高等原因已经不能满足当下的市场环境。在大数据时代,利用数据驱动手段,高效、客观地获取及分析客户需求成为产品开发中亟待解决的问题,为此,对客户需求的获取与分析方法进行了研究,提出了
随着国内城市化程度越来越高,更多的人口涌入城市,各大城市人口的不断增加对城市公共交通的压力越来越大,城市轨道交通作为城市公共交通的主要方式之一,成为城市居民出行必不可少的出行方式,目前我国已经通过城市轨道交通企业建设并运营开通地铁的城市已达35个。随着城市轨道交通在国内的快速发展,各大城市的轨道交通企业面临着建设融资需求量巨大、企业短期盈利能力较弱等问题,为此各大城市轨道交通企业创新投融资模式,寻
我国经济飞跃向前发展,商业建筑体的形式也越来越趋多样化。大型商业综合体通常会集餐饮、客房、商业、娱乐于一体,内部的人员组成及密度复杂多变,大量的有害有毒烟气和庞杂的疏散路线都对商业综合体的应急疏散提出了严苛的条件。本文主要通过国内外文献调研和实地调研两种方式进行商业综合体火灾应急疏散过程分析,得出城市大型商业综合体应急疏散过程的相关结论,提高人员疏散的安全性。本文的主要研究内容及成果如下:(1)通