基于深度学习的文本蕴含技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ys331223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言中的推理关系,又称为文本蕴含关系,是一种基本的文本间语义联系,广泛存在于自然语言文本中。很多信息处理任务或多或少地都需要面对包含蕴含关系的文本。如果有一种技术能够处理其中的蕴含关系,那这种技术就能够为这些任务提供助力。因此,文本蕴含相关研究是自然语言处理领域的一项基础性工作,可以辅助其他信息处理任务的进行,并且具有丰富的应用场景。一般的二元关系研究,通常围绕二元关系的识别、抽取、生成这三个基本研究任务展开。类似地,作为一种二元关系,文本蕴含也有3个基本研究任务——文本蕴含关系识别(又称为自然语言推理)、文本蕴含知识挖掘和文本蕴含后件生成。尽管取得了不错的进展,但之前的有关研究存在一些局限:(1)文本蕴含关系识别模型复杂,难于训练;(2)自然语言推理方法不能有效地结合知识;(3)蕴含知识的挖掘不能同时兼顾覆盖率与准确率;(4)文本蕴含的生成不能有效保留重要信息,同时缺少客观的评价指标。本文针对已有方法在这三个基本研究任务中存在的四个问题展开,分别提出了四种模型,均在公开的数据集上取得了当时最高成绩。本文基本研究内容如下:1.基于高斯Transformer的文本蕴含识别研究:目前基于神经网络的文本蕴含识别模型大致可以分为三类:循环网络模型、卷积网络模型和自注意力网络模型。尽管取得了不错的准确率,但是循环网络模型难以并行处理句子中的单词,拖慢了训练速度;卷积网络模型耗费参数较多;而自注意力网络模型弱于捕获文本的局部信息。为了解决这些问题,本文在Transformer的基础上提出了一种高效的无循环或卷积的模型,称为高斯Transformer。实验结果表明本文提出的方法在公开评测集上取得了当前最好的成绩。2.基于知识图谱的文本蕴含识别研究:对人类而言,知识在推理中扮演了重要角色,但是前人工作对知识的利用涉及的较少,尽管在标准的自然语言推理评测中取得了不错的成绩,但是当应用到诸如医疗等知识密集型领域时,就会捉襟见肘。为了填补这一知识空白,本文提出了一种基于知识图谱的推理模型(EBIM),利用知识图谱中的相关路径作为推理证据提升文本蕴含识别性能。在自然科学问答评测语料(Sci Tail)上,EBIM方法优于其他借助外部知识库的方法;在医疗自然语言推理评测集(Med NLI)上,EBIM方法取得了当前最好成绩。3.基于深度语境网络的谓词型文本蕴含推理规则挖掘研究:蕴含知识往往以推理规则的形式存在。前人利用诸如分布假设和隐含迪利克雷分布等统计方法来抽取谓词型推理规则。但是这些研究无法较好地平衡所挖掘的推理知识的覆盖率和准确率,从而下游任务带来许多不确定性。为了解决这一问题,本文提出了一种新的模型,即深度语境网络。它能够同时捕获统计信息和语义信息,进而更好地建模谓词的语境。在公开数据集上的实验表明本文的方法同时在覆盖率和准确率上优于现有方法。4.基于残差长短时记忆网络的文本蕴含后件生成研究:当前序列到序列的文本蕴含生成方法常常遗忘原句的有效信息,难以处理较复杂的蕴含前件。此外,文本蕴含后件生成任务目前缺少一个合理的评价指标,当前指标不能适应文本蕴含现象的多样性,阻碍了这一领域的发展。针对这两个问题,本文首先提出了一种基于残差长短时记忆网络的文本蕴含后件生成模型,然后为该任务提出了一种称为EBR的评价指标。实验表明,本文所提出的模型取得了当前最好的性能;并且EBR评价指标克服了现有指标的不足,显示了与人工评价的高度一致性。
其他文献
【目的】明确新疆南部极端干旱区滴灌小麦目前灌量是否合理及灌水量阈值。通过分析新疆南部极端干旱区滴灌小麦在水分利用方面的现状,为进一步解析滴灌冬小麦产量提升及节水
无论是哪一门学科的学习都需要学生带着兴趣去学习,这样才能在学习的过程中收到最好的效果。在小学语文教学的过程中教师要重视知识的运用,要让学生意识到语文知识的实用性,
前言 根据《中华人民共和国传染病防治法》《消毒管理办法》和《医院感染管理办法》制定本标准。本标准按照GB/T 1.12-9给出的规则起草。
通过面对面的访谈,对我国东北平原、华北平原、成都平原和西北绿洲区4个典型生态类型区的666户农户进行了保护性耕作技术认知情况调查。表明我国保护性耕作模式比较多,产量效
<正> 明代是我国茶业和茶文化继往开来的重要发展时期,先后有50多部茶书问世,本文拟就万历年间三部重要的茶书,即张源作于万历二十三年(1595年)前后的《茶录》、许次纾作于万