基于深度学习的中文命名实体识别及事件主体抽取研究

来源 :湖南工业大学 | 被引量 : 0次 | 上传用户:scsnlaosi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“工业4.0”、“互联网+”和“大数据”的迅速发展,网络信息呈爆炸式增长,如何从浩如烟海的互联网数据中抽取有价值的信息是当前研究的热点。信息抽取的主要目的是从海量自然语言文本中分类提取出用户感兴趣的框架信息,基本任务包括命名实体识别与事件抽取,为产业知识图谱的构建提供重要的技术支持,而事件主体抽取作为事件抽取的关键子任务,扮演着同等重要的角色。论文主要研究内容为命名实体识别和事件主体抽取,研究成果如下:(1)提出一种基于Attention-Bi LSTM深度神经网络的命名实体识别模型。应用Bi LSTM神经网络自动学习文本的隐含特征,可以解决传统识别方法存在长距离依赖等问题;引入注意力机制对文本全局特征做重要度计算,获取文本局部特征,解决了传统深度学习方法不能充分提取特征的问题;在预训练过程中加入维基百科知识,进一步提升了命名实体识别系统的性能。实验表明,所提方法在SIGHAN2006 Bakeoff-3评测数据集上获得了较好的识别性能。(2)提出一种基于词典和字词联合特征的深度学习模型进行领域命名实体识别。首先构建领域词典匹配句子中词语的类别特征,同时将文本转换为字特征和词特征联合的向量特征,并且在过程中加入POS信息。然后将以上特征联合馈送到Attention-Bi LSTM深度神经网络模型进行领域命名实体识别。通过对《中国包装网》新闻数据集的实验,所提方法在领域命名实体识别中优于传统方法。(3)提出一种基于门控多层次注意机制的ELMo-BGRU神经网络模型进行事件主体抽取。使用ELMo预训练模型生成上下文相关的动态词向量,在一定程度上缓解了一词多义的问题;利用BGRU神经网络捕获时间序列中长距离依赖关系并减少梯度消失问题;为了处理句子中存在事件模糊性的问题,采用门控多层次注意机制动态融合每个词的句子级信息和文档级信息。使用CCKS2019任务四的数据集进行验证实验,结果表明,文章方法的抽取效果明显优于传统抽取方法,可以有效解决事件主体抽取的问题。
其他文献
自石墨烯的成功制备以来,二维材料在光电子学领域的前景就受到了人们的关注,其中过渡金属硫族化合物由于其电子结构的非对称性以及光电子学领域的优异性质而备受关注。近年来
教练员的执教能力的高低影响着运动员个体及全队的竞技水平,在一支优秀的运动队中教练员起着至关重要的作用。但是,现如今教练员执教多项能力指标及影响因素的模糊化,成为困
近年来,由于煤炭、石油、天然气等传统化石能源面临枯竭以及严峻的环境污染问题,开发和利用含量丰富无污染的太阳能势在必行。然而在对太阳能开发利用的过程中,发现大多数材
六硝基六氮杂异伍兹烷(HNIW,CL-20)是当今世界综合性能最好的单质炸药,在推进剂、混合炸药、发射药等领域有广阔的应用前景。CL-20传统合成工艺需要将HBIW进行两次氢解制得最佳硝化前体TAIW,两次氢解均需用到昂贵的钯催化剂,成本高且反应路线长,探索非苄基取代的六氮杂异伍兹烷的合成及经济廉价的CL-20合成新工艺具有重要意义。本文基于新法搭笼路线,分别以1-萘甲胺、2-萘甲胺、2-呋喃甲胺
随着信息技术的快速发展,社会生产中产生的数据呈爆炸式增长,如何从这些海量的数据中智能高效地进行知识发现已经成为人工智能领域中的研究热点。如何处理不确定信息并从中挖掘出有价值的知识,是知识发现中面临的一个关键问题。粗糙集理论作为处理不确定性问题的一种有效的数学工具,由于在处理不确定性问题时无需提供除数据本身以外的任何先验知识,近年来已经成为了处理不确定信息的重要方法。粗糙集模型的上、下近似集在描述不
随着经济的快速发展,网络正在我们生活中扮演着重要的角色,与我们的生活息息相关,给我们的生活带来了极大的便利。但与此同时,网络规模的不断增大,网络所面临的威胁也逐年增
选择性激光熔化(Selective Laser Melting,SLM)是近年迅速发展起来的一种增材制造技术,它能够直接成形具有复杂结构且致密度超过99%的金属工件,具有广泛的应用前景。在SLM加
大部分数鱼类是变温动物,寒冷压力对于鱼类的生长以及生殖等重要过程都具有重大的影响,鱼类冷适应机制一直以来都是研究的热点。环境温度变化具有即时性的特点,传统遗传学无法很好地解释短时间内产生的冷适应性状,这就需要通过表观遗传学进行分析研究。鱼类作为真核生物,其细胞核内的染色质高级结构具有复杂且高度动态化的特点。根据环境压力变化,在较短的时间内调控基因的表达,产生有利的性状,能够帮助生物快速适应环境,获
基于稀疏SLAM(Simultaneous Localization And Mapping)框架的三维信息估计技术,在三维重建,路径规划、增强/虚拟现实等领域都具有重要的研究意义与应用价值。然而,目前系统
本文通过在火花塞顶置式定容燃烧弹中添加扰流装置,实现了加速氢-空预混火焰燃烧进程,同时研究了扰流装置的结构参数和初始条件对氢气-空气预混燃烧特性的影响规律。首先,分