【摘 要】
:
文本问答,旨在构建能够回答任意自然语言问题的计算机系统,是自然语言处理与人工智能领域内最具难度的挑战之一。阅读理解式问答,又称机器阅读理解,是文本问答的一个子任务,在近年来受到学术界和产业界的极大关注。机器阅读理解的目标是教会机器阅读并理解人类语言文本并回答相应问题。由于该任务天然地可以被用来衡量机器自然语言理解能力,因此具有重大的研究价值。此外,阅读理解技术还能被广泛应用于问答应用、搜索引擎以及
论文部分内容阅读
文本问答,旨在构建能够回答任意自然语言问题的计算机系统,是自然语言处理与人工智能领域内最具难度的挑战之一。阅读理解式问答,又称机器阅读理解,是文本问答的一个子任务,在近年来受到学术界和产业界的极大关注。机器阅读理解的目标是教会机器阅读并理解人类语言文本并回答相应问题。由于该任务天然地可以被用来衡量机器自然语言理解能力,因此具有重大的研究价值。此外,阅读理解技术还能被广泛应用于问答应用、搜索引擎以及对话系统中,故具备极强的实用性。近年来,随着大规模阅读理解数据集的发布以及深度学习技术的快速发展,机器阅读理解相关研究取得了令人瞩目的进展。尽管取得了如此成就,却仍然存在许多挑战如:1)当前方法的模型结构和训练方法中存在制约模型性能的问题;2)当前具备顶尖性能的集成模型在实际部署时效率低下;3)传统方法往往是在段落中必须存在答案的假设下设计的,因此无法有效处理无答案问题;4)当前大部分模型是针对单段落场景设计的,故无法有效扩展至开放域问答;5)当前大部分模型无法有效支持离散推理和多答案预测等情况。因此,为了应对上述挑战,本文聚焦机器阅读理解,从注意力机制、训练方法、知识蒸馏、答案验证架构、开放域问答和多类型-多答案预测机制等方面开展若干关键技术研究与实证分析。本文的主要贡献总结如下:第一,针对当前多层注意力架构中的注意力冗余与缺乏问题,以及强化学习训练方法中的收敛抑制问题,提出一个面向抽取式阅读理解的强化助记阅读器,以提升模型性能。该模型在多层注意力架构中引入重关注机制,并在训练时采用动态-评估的强化学习方法来解决上述问题。在阅读理解基准数据集上的实验结果表明,相比之前方法该模型获得了极大的性能提升,我们的集成模型甚至取得了和人类媲美的精确匹配性能。第二,针对知识蒸馏过程中的有偏蒸馏问题,以及无法高效蒸馏中间表示的问题,提出一个面向阅读理解模型压缩的知识蒸馏方法——注意力指导的答案蒸馏方法,以提升模型效率。该方法综合利用标准知识蒸馏、答案蒸馏以及注意力蒸馏来在不降低模型性能的情况下将集成模型压缩为单模型。在三个阅读理解基准数据集上的实验显示,蒸馏后单模型效率得到大幅度提升,且性能甚至在两个数据集上超过了集成模型。第三,针对无答案阅读理解模型的概率互相干扰问题,以及当前方法缺乏一个独立的答案验证阶段的问题,提出一个面向无答案问题的阅读+验证架构,以提高模型对无答案问题的检测精度。该架构包含一个在抽取候选答案的同时检测无答案问题的无答案阅读理解模型,以及一个用来进一步判断预测答案是否正确的答案验证模型。此外,我们引入了两个辅助损失函数来增强阅读理解模型,同时探索了针对答案验证任务的三种网络结构。在斯坦福问答数据集2.0版上的实验显示,该架构在面对无答案问题时的检测精度得到显著提升。第四,针对当前流水线方法面临的训练-测试不一致和重复编码问题,提出一个面向开放域问答的检索-阅读-重排序网络,以提高开放域问答系统性能。该模型包含一个早期停止的检索器、一个远程监督的阅读器、以及一个跨度级答案重排器。这些组件被集成到一个统一的神经网络中以便进行端到端训练来缓解训练-测试不一致问题。另外,编码表示能在多个组件之间被复用以避免重复编码。在四个开放域问答数据集上的实验显示,该模型相比流水线方法性能更优,同时效率更高。第五,针对当前离散推理阅读理解模型面临的答案类型覆盖不全、无法支持多答案预测以及孤立预测算术表达式等问题,提出一个面向离散推理阅读理解的多类型-多跨度网络,以提高在离散推理场景下的模型表现。该模型使用一个多类型答案预测器以支持对四种答案类型的预测,采用一个多跨度抽取方法以动态地抽取指定个数的文本跨度,并使用一个算术表达式重排名机制来对若干候选表达式进行排序以进一步确定预测。在离散推理阅读理解基准数据集上的实验表明,该模型显著提高了答案类型覆盖度和多答案预测精度,因此相比之前方法性能获得了大幅度提升。
其他文献
高性能计算机的出现和快速发展,使其被广泛应用于云计算、安全、大数据处理等领域。据统计大数据处理占据了46%的份额位居榜首。存储结构的复杂多样,计算机体系结构的多样性以及大数据处理问题体量大、数据复杂多样等特点,高性能计算机在大数据处理领域的应用面临着巨大的挑战。本文主要研究多种存储结构下不同应用场景的异构并行算法和优化技术,选取了大数据处理中的迭代算法、高吞吐率需求、大规模网络融合三种典型的应用问
传统通用处理器的设计与制造受限于功耗、散热等因素,其计算能力的持续提升遇到瓶颈,不能满足人们日益增加的计算能力需求。由通用多核处理器和专用加速器组成的异构众核系统具有很好的计算能耗比,在高性能计算领域和嵌入式计算领域都得到了越来越广泛的应用。然而,通用多核处理器与加速器间的数据搬运开销(通信开销)却成为影响异构程序性能的重要因素。多任务流技术是一项可以高效利用异构系统计算资源的编程技术。它通过对计
非合作双基地雷达利用第三方辐射源发射的信号实现目标探测,由于其本身不辐射信号,因此战场生存能力强,并且能够有效弥补传统单基地有源雷达在抗干扰和反隐身等方面的不足,具有广阔的军事应用前景。课题研究的非合作双基地雷达系统基于波形参数捷变相控阵雷达辐射源,其复杂的波形调制形式给非合作双基地雷达的信号处理带来了许多困难。本文在课题组研制的非合作双基地雷达系统样机的基础上,围绕系统在信号处理中面临的实际问题
得益于当前软硬件技术和互联网的飞速发展,云计算已经成为最具影响力的信息基础设施,在社会生产生活的各个领域都有着广泛的应用。通过将各种硬件资源整合和虚拟化,云计算为用户及其应用提供了一个灵活、高效的虚拟化存储和计算环境。然而,云计算中的虚拟化环境在给用户带来便捷服务的同时,也面临着来自不同层面的安全威胁。与此同时,日益丰富的攻击手段和虚拟化导致的攻击面拓宽,给虚拟化环境的安全保护带来了新的挑战。如何
离子具有相干时间长、保真度高等优点,因此囚禁离子系统是实现量子计算、量子模拟以及精密测量的重要平台之一。囚禁离子系统的规模化与集成化是近年来研究的热点。表面电极离子阱是解决这一问题的主要平台之一,但其研究还处于探索阶段。本文主要研究了表面电极离子阱的优化设计、离子阱的制备及囚禁离子系统的优化。主要内容与创新点如下:1、设计了具有装载区、操作区与传输区的多功能表面电极离子阱。提出了径向双势阱来作为操
随着高性能计算、大数据与人工智能的不断融合,高性能计算社区亟需同时支持这三种场景的计算系统来加速科学发现。然而,爆炸性增长的科学数据以及不同场景下应用截然不同的I/O特征促使融合应用呈现前所未有的复杂性。与此同时,不断加深的存储层次和多样化的数据定位需求进一步增加数据管理难度,导致高性能计算系统面临严峻的数据存储与管理挑战。为了在高性能计算系统上有效支持融合应用,本文结合层次式存储结构和应用特征,
随着人类社会的不断发展,软件的规模日益复杂,形式也众彩纷呈。但是软件危机就像一个如影相随的恶魔,经常在不经意中给人类造成损失。尤其是关乎国计民生的领域,对安全更加十分重视。金融、国防、航空航天等领域部署的软件,更是安全攸关。如何抵御“恶魔”?一方面,软件工程提出一整套的理论来帮助人们在软件开发过程中按照规范的流程来生产;另外一方面人们研究各种的软件质量保证技术来检测生产出来的软件是否可靠,测试、模
密码函数通常用于分组密码核心组件S盒的设计,其密码学性质的好坏直接关系到密码算法的安全性。本文围绕与分组密码S盒设计相关的密码函数进行研究,研究了具有高非线性度、高代数次数的4差分置换的构造及其CCZ等价性,m>n/2情况下具有低差分均匀度、高非线性度、高代数次数的(n,m)函数的构造,以及低重量高阶相关免疫布尔函数的构造,这些结果可以为SPN结构分组密码S盒的设计,Feistel结构分组密码S盒
近年来,自由空间涡旋光通信以其极大的通信容量和极高的频谱效率在国内外引起了广泛关注,涡旋光所携带的轨道角动量理论上取值无穷且彼此正交,能够为光通信提供新的维度资源。然而,涡旋光在自由空间传输时,不可避免地受到大气信道的影响,导致承载信息的轨道角动量态间产生串扰,造成通信系统性能下降。本文围绕自由空间涡旋光通信检测技术展开研究,首先针对轨道角动量在自由空间中的传输特性进行分析,重点研究了大气湍流、大
图像标注(Image Captioning)是指利用计算机自动生成自然语言句子来描述给定图像内容。这就要求计算机首先要全面、详细地理解图像内容,即有效表征图像包含的物体、物体属性以及物体间的相互关系;然后,将图像内容转化为一句语法、语义正确的自然语句。其中,理解图像内容隶属于计算机视觉领域,而自然语言表达是自然语言处理中的重要任务之一。因此,图像标注涉及计算机视觉和自然语言处理两大学科领域。随着深