基于双向注意力和标签软化的抽取式阅读理解研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:userlyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解是人工智能和自然语言处理领域的一个重要研究课题,是自动问答模型的关键支撑技术,有着重要的研究意义和广泛的应用价值。随着互联网的发展和技术的进步,研究者提出了各种阅读理解模型,在部分数据集上可以达到超越人类的效果。然而,机器阅读领域仍然有大量未解决的问题需要继续探索,研究机器阅读理解模型的进一步优化对学术界和工业界都有重要意义。得益于技术的发展和运算速度的提升,大规模预训练语言模型被提出并在许多自然语言理解任务上都有亮眼表现。然而,这些模型在抽取式阅读理解任务中的应用方法仍然较为简单,在模型结构和数据构成上都有可以优化之处。本文主要从一种预训练语言模型—ALBERT入手,从模型和数据两方面分别基于双向注意力和标签软化对该模型进行优化,使其在抽取式阅读理解任务中能有更好的表现。首先,本文对ALBERT在抽取式阅读理解任务中的应用效果进行了验证。分析了ALBERT的模型特点和主要优势,并在SQu AD 2.0、News QA、QUOREF三个数据集上进行了实验验证。实验结果表明该模型在三个基准数据集上都有较好的表现,在SQu AD和News QA上可以超越人类,在News QA和QUOREF上达成state-of-the-art。随后,本文从模型角度基于双向注意力机制对ALBERT进行了优化,提出ALBERT-CA模型。针对ALBERT缺乏对参考文本与问题之间关系的显式建模的问题,引入了基于双向注意力的交互层;针对解码过程中两个边界相互独立的问题,建立了答案边界之间的神经网络连接。实验结果证明ALBERT-CA在处理抽取式阅读理解任务时相比于ALBERT有明显优势。额外的消融实验则证明了在模型上主要的两点优化都是有效的,以及双向注意力计算时有必要加入原始信息。最后,本文从数据角度进行优化,提出了基于软标签的数据增广,可以利用抽取式阅读理解的多解性提升模型性能。尝试了标签平滑、分布预测两种软标签构造方式,为上下文其他词语也赋予一定的概率。使用增强后的数据集训练ALBERTCA模型,两种方案得到的结果都有一定的提升。标签平滑得到的软标签不能突出其他正确答案,但依然有效,我们认为这可以说明多解性在阅读理解任务中十分普遍。更加精确的分布预测可以进一步增强模型性能。应用本文中提到的种种优化之后,在模型性能上的提升十分明显,可以为后续研究提供参考。同时,这些优化思路都不仅限于ALBERT模型,在其他模型上也可以应用,有一定的推广价值和学术意义。
其他文献
类风湿性关节炎(Rheumatoid arthritis,RA)是一种常见的自身免疫性疾病,病理特征包括滑膜组织的过度增生,关节局部的炎症反应,关节骨和软骨组织的破坏。RA关节破坏的机制尚不
近年来我国科技发展迅速,高清视频、虚拟现实以及物联网等各种高新网络应用和技术层出不穷,极大的改善了网民的生活体验,基本上实现了万物互联的智能时代。思科白皮书预测在
自旋电子学是物理学中一个新兴的研究领域,是磁学与微电子学相结合的一门交叉学科,用于研究电子的自旋而非电荷在固体物理学中所起的作用,通过操控电子自旋可以发展具有广大
聚类方法是数据挖掘的重要组成部分,其目的是把相似的数据对象聚在一起,把不相似的数据对象尽可能地分离,是一个极富挑战性的研究领域。DBSCAN是一种性能优越的基于密度的聚
随着国家经济社会快速发展,人民对体育需求不断提高,体育事业同样需要顺应时代的发展,体育现代化进程中就是体育不断满足人们美好生活的需要。本文运用文献资料法、德尔菲法
光场(LightField,LF)成像以其独特的成像原理而备受关注。传统相机拍摄的图像只能记录光线投影到二维平面的位置信息,忽略了光线传播的方向信息。通过密集微透镜组成的阵列进
人际宽恕不仅可以改善人际关系,还可以促进社会和谐。以往研究将人际宽恕区分为决定性宽恕与情绪性宽恕,但少有研究综合考察情绪调节的不同方式对决定性与情绪性宽恕的不同影响,以及认知抑制在其中可能的中介作用。基于此,本文通过三个研究考察了不同情绪调节策略对决定性宽恕与情绪性宽恕的影响,以及认知抑制的中介作用。希望通过以上研究的探讨,揭示情绪调节对人际宽恕的影响过程中认知抑制所具有的作用,为促进人际关系、社
配电系统中存在着很多不平衡感性负载,其产生的无功和负序电流不仅会增加线路的损耗,还会引起以负序分量启动的继电保护装置误动作,威胁着电力系统的安全运行。通过并联补偿装置进行无功补偿和不平衡抑制来提高电能质量得到了广泛的研究。动态电容器(Dynamic Capacitor,D-CAP)是一种新型的电能质量补偿装置,成本低且性能优异,在无功补偿领域有着很好的发展前景。在目前的研究中,动态电容器已成功实现
多孔介质孔隙裂隙结构广泛存在于煤岩体结构、分子材料等自然物质和人工合成物质中,而流体在多孔介质中的流动称为渗流,传统渗流研究一般从宏观角度出发,而不关注实际孔隙、裂隙内的具体流动情况,因此本文类比真实多孔介质孔隙裂隙结构并基于孔隙裂隙基础定义,以四参数随机生成法构建孔隙裂隙结构模型,利用介观模拟方法格子Boltzmann方法对多孔介质孔隙裂隙结构进行渗流模拟,对“基于格子Boltzmann方法的多
本文利用WRF-Chem模式对深对流系统对污染气体垂直输送作用进行了数值模拟,研究了不同强度的深对流系统对输送作用的影响作用,并使用不同的微物理和边界层参数化对一次深对流系统进行模拟,研究不同参数化方案对深对流垂直输送污染气体的影响作用。本文对2014年7月27日和8月24日发生于长三角地区的两次强度不同的深对流系统对污染气体CO的再分布进行了研究,对比分析了模拟的两次深对流系统在CO垂直输送过程