【摘 要】
:
共指消解旨在识别文本中指向同一实体的不同表述,在多项高级自然语言任务中起到重要的基础支撑作用。随着自然语言处理的快速发展,越来越多学者将深度学习应用到中文共指消解的研究中。然而,目前基于深度学习的中文共指消解模型往往采用静态词向量和循环神经网络对文本进行编码,无法很好地建模文本的上下文语义。此外,这些模型只关注表述的局部特征,忽略了实体信息特征对于共指消解任务的重要性。针对上述问题,本文提出一种基
论文部分内容阅读
共指消解旨在识别文本中指向同一实体的不同表述,在多项高级自然语言任务中起到重要的基础支撑作用。随着自然语言处理的快速发展,越来越多学者将深度学习应用到中文共指消解的研究中。然而,目前基于深度学习的中文共指消解模型往往采用静态词向量和循环神经网络对文本进行编码,无法很好地建模文本的上下文语义。此外,这些模型只关注表述的局部特征,忽略了实体信息特征对于共指消解任务的重要性。针对上述问题,本文提出一种基于预训练语言模型和实体信息增强的端对端神经网络中文共指消解模型,采用短语排序的思想,将文本中的短语当作潜在的表述,进行后续的消解操作。该模型使用中文预训练语言模型BERT-wwm-ext作为文本编码层,充分学习文本的深层语义特征,获取语义知识更丰富的文本向量表示。此外,为了模型在消解过程充分考虑全局特征,使用多次迭代的方式将消解结果通过门控机制对表述的向量表示进行优化,从而加强实体信息在消解过程中的影响。实验结果表明,本文提出的中文共指消解模型在Onto Notes 5.0中文数据集上取得了68.88%的平均F1值,对比当前主流方法有较大的提升,可以有效地提升中文共指消解任务的效果。此外本文还通过设计多组对比实验,证明融入预训练语言模型和全局实体信息特征都可以有效地提升模型的性能。最后,基于提出的神经网络中文共指消解模型,本文实现了一个中文共指消解系统,详细介绍了系统的总体结构、模块设计和系统展示,在实践中探讨本文模型应用的可行性。
其他文献
电网跳闸故障的快速准确识别对于维持电网供电的可靠性起到重要作用,针对当前电网故障识别算法存在故障元件识别算法容错性差、计算速度慢,故障类型辨识算法易受各种噪声影响以及故障原因分析算法缺失等问题,本文设计了一套考虑保信、故障录波以及外部气象告警信息的电网跳闸故障诊断算法以实现电网故障元件的快速、准确识别,并能辨识故障类型及量化分析故障原因。论文主要工作包括如下几个方面:首先,针对传统电网故障元件识别
随着交通量、路面使用年限的增长,沥青路面结构病害逐年加重,对路面使用性能状况进行科学合理的评价和预测,是制定路面养护决策的重要依据。本文考虑路面评价的模糊性和不确定性特点,开展基于融合权重的正态云模型沥青路面使用性能评价方法研究,同时构建基于XGBoost算法的路面使用性能预测模型,探究机器学习在路面使用性能预测中的应用。首先,对广东省普通国省道发展状况进行分析,考虑自然环境、气候、交通量的影响,
当今的移动通信仍在快速变革,窄带物联网(Narrow Band Internet of Things,NBIoT)低功耗、广覆盖的特点让其在众多传统领域产生广阔的应用场景。由于NB-IoT典型的工作信噪比小于0d B且它简化的物理信道等原因,现有的广泛用于OFDM(Orthogonal Frequency Division Multiplexing)系统的信道估计器不能直接适用,因此研究一种在NB
氧离子导体膜是一种在中低温条件下具备高氧离子电导率的致密陶瓷膜,理论上其对氧气的选择性为100%,并且可通过调节膜两侧的电流密度大小调控透氧量大小。然而要在工业上进行应用,氧离子导体膜的透氧性能还需要作进一步的优化。目前主要是通过离子掺杂来增加氧空穴浓度从而优化透氧膜的性能,其中,传统的掺杂手段为金属离子掺杂如碱土元素和稀土元素等,但未对碱土元素掺杂LAMOX型氧离子导体的透氧性能进行系统研究。近
人口老龄化是社会发展的必然产物,随着人们生活水平的提升,老年人的需求逐渐从物质与健康层面转移到了精神娱乐层面,益智玩具作为精神娱乐需求的重要载体,不仅可以延缓老年人的智力衰退,也可缓解其孤独感。而目前国内对于老年人益智玩具需求的重视程度不足,较少有关于老年人益智玩具方面的研究,国内老年人玩具市场尚存在较大的发展空间。由于老年人在生理及心理方面与设计研究人员与存在较大差异,使用传统的研究方法难以挖掘
在宏大历史题材的展陈设计创作中,全局观是必不可少的。以国家红色主题设计的概念界定和要素构架为基础,根据对党史馆的策展理念及展览内容的分析与研究,从宏观的布局到具体的人事物的表达,致广大尽精微,寻找到以"人"在认知过程中为主导和决定的要素,以实现全因素的沉浸式表达为目标的展陈设计思路,提出"具身认知"的设计理念,它包含了对中国共产党历史展览内核的宏观判断并与之一致。因此,通过"具身认知"理念与全因素
双目图像超分辨率重建算法通常使用具有两个不同视角的双目图像来为图像超分辨率重建提供更多的有用信息,以便能够重建出高质量的超分辨率图像。但是,如何准确有效地捕获双目图像中长距离的相互依赖关系是双目图像超分辨率算法研究的重点。故本文分别提出了基于空间和通道注意力机制的双目图像超分辨率网络(Parallax-based Spatial and Channel Attention Stereo Super
镍基高温合金因其具有较好的高温强度及抗氧化腐蚀性能,被用作航空、航天发动机及燃气轮机热端部件的关键材料,镍基高温合金锥筒形构件是航空发动机及燃气轮机燃烧室中广泛使用的一类基础零部件。剪切旋压与拉深旋压分别是成形锥形件及筒形件的最有效方式,采用剪切-拉深复合旋压成形是制备镍基高温合金锥筒形件最有效的精确塑性成形方法之一。可旋性是判断材料是否能顺利旋压成形的理论依据,由于镍基高温合金显著的加工硬化效应
近些年,随着我国劳动红利逐渐减弱以及环保措施日趋严格,制造业转型压力加大。在此情形下,实施制造业服务化转型成为企业的一种现实选择。尽管已有许多学者对此现象进行了研究,但是得出的结论却不尽相同。因此,有必要对制造业服务化进行更加深入的研究,以期为我国制造业转型升级提供一定的借鉴价值。论文首先围绕制造业服务化概念、与企业绩效的关系以及服务化影响因素,对国内外相关文献进行了系统回顾。总结归纳了影响服务化
高速公路夜间养护施工作业的安全问题是高速公路建设领域一个重要的前沿研究问题与实践问题,以往的研究主要聚焦在高速公路日间养护施工作业或新建、改扩建施工作业的风险因素辨识和评价,对高速公路夜间养护施工作业风险定量分析尚缺乏系统的研究,本文旨在通过结构方程模型(Structural Equation Model,SEM)和贝叶斯网络(Bayesian Networks,BN)对高速公路夜间养护施工作业风