面向推理类问题的机器阅读理解及其鲁棒性研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:vitaminchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解(Machine Reading Comprehension,简称MRC)是一项针对给定文本和特定问题自动生成或抽取相应答案的问答任务,该任务是评估计算机系统对自然语言理解程度的重要任务之一。目前已有大量开源机器阅读理解数据集发布,且现有的阅读理解模型已在非推理类数据集(如:SQuAD,TriviaQA等)上取得了与人类可比甚至超越人类的性能表现。但在考验模型推理能力的数据集(如:HotpotQA等)上与人类的性能表现仍有明显差距。为了提升现有阅读理解模型的推理能力,本文在HotpotQA数据集上展开研究,将推理类问题分为数值比较类问题与多跳推理类问题分别展开研究。针对数值比较类问题,本文提出一种包含线索文档判别、问题极性判别、文档极性判别、答案抽取与答案选择五个模块的神经阅读理解模型CQA,专门用于回答数值比较类问题。实验结果表明,CQA相较基线模型在HotpotQA数据集的比较类问题上平均F1值从52.27%提升至63.09%。针对多跳推理类问题,本文提出一种流水线式的解决方法RTR,该方法首先使用基于BERT的线索文档判别模型进行问题无关文档过滤。其次,使用基于多任务联合训练的阅读理解模型进行答案推理,该模型效仿人类找寻线索与推理答案的基本方式,分别执行支持事实判别和答案抽取两个关键步骤。RTR在HotpotQA数据集上取得了与前沿系统可比的性能表现。此外,为了使具备推理能力的模型投入实际生产应用,本文进一步构造了鲁棒性数据集HotpotQArobust,用以研究这些模型的鲁棒性。HotpotQArobust从过敏感和过稳定两个方面挑战现有的阅读理解模型。实验结果表明,无论是基于预训练语言模型,亦或是基于循环神经网络的阅读理解模型在HotpotQArobust鲁棒性测试集上的表现均比原始测试集有明显下降。本文也分析了现有模型在鲁棒性测试集上的行为表现,并有针对性地尝试提升模型鲁棒性的方法,这将为未来的模型开发提供建议。
其他文献
企业科研投资对于创新驱动发展战略具有深刻意义。相比于主板市场,创业板上市公司多为高新技术企业,公司的发展前景和潜力较好,研发投入资金水平较高。但是,创业板上市公司由于成立时间较短、管理水平有限等因素,在创新过程中对于筹集足够资金进行创新投资较为困难,其融资约束难题亟需解决。本文以我国创业板上市公司2013—2019年的数据分析融资约束对其创新投资的影响,并基于股权结构进一步分析了高管持股、机构投资
学位
目的 汉化老年人社会支持评价(the social support appraisals scale, SS-A)量表,并进行文化调适和信效度检验。方法 遵循Brislin翻译模式进行量表的翻译、回译及文化调适。采用便利抽样对548名老年人进行一对一访谈调查,分析中文版量表的信度和效度。结果 中文版量表共包含20个条目,3个维度。结构效度:探索性因子提取3个因子,可解释的总变异为59.706%;模
期刊
<正>1942年5月,毛泽东的《在延安文艺座谈会上的讲话》指导了中国新民主主义革命和社会主义革命时期文学艺术的发展,强调了文艺为工农兵服务的方向,进一步加强了音乐作为救亡武器的观念认知,指明了意识形态领域内文艺的发展问题,推进了马克思主义美学中国化的进程。自延安文艺座谈会以来,在党中央的一再倡导下,音乐工作者们相继开始融入民间,学习、体察、采风,文艺工作者开始自发性地深入民间生活,吸取民间滋养,
期刊
21世纪是信息技术飞速发展的时代,信息技术的出现大大提高了社会生产力,也为人们的日常生活提供了极大的便利。但用辩证的眼光来看待信息技术,可以发现其在助力社会发展进步的同时,也引发了信息盗窃、信息滥用、信息轰炸等负面问题,个人信息被泄露、滥用的风险很大。大数据时代背景下,个人信息安全风险的增大,相应地要求个人信息保护制度变得越来越成熟、完善。然而,由于我国的公权力机关在个人信息安全保护方面存在支持力
学位
银行信贷是企业创新的重要资金来源,但由于创新活动具有收益不确定性和信息不对称性,风险偏好度较低的银行对企业创新活动采取较为谨慎的态度。同时,银企之间存在收益与风险不对称问题,即银行无法分享企业创新成功产生的回报,却要承担企业创新失败无法偿还贷款的风险。因此,银行可能会发挥贷款人的监督作用干预企业的创新活动过程,比如通过贷后治理机制限制企业的创新研发投入。企业的创新研发活动面临银行信贷约束问题,巨大
学位
自全面“营改增”之后,我国的增值税税率进行了多次下调。制造业是我国的支柱产业,对推动经济高速发展起到至关重要的作用。增值税税率下调对制造业企业的影响效果引起了社会的广泛关注。对增值税税率调整政策的研究,一方面可以让政策制定者检验政策的有效性,另一方面能够使企业了解自身在政策中的获益程度以及如何应对新的增值税改革措施。本文在理论层面从税负效应和价格效应两个方面探讨增值税税率下调对制造业企业成长性的影
学位
网络技术的发展赋予了信息处理技术新的发挥空间,能够实现全收集全分析的云计算技术使得互联网企业对个人信息的采集与利用效率产生了划时代的蜕变。大数据化的个人信息成为了企业产品迭代与竞争的关键因素。信息处理方式的进化让建立在前互联网时代的个人信息保护方式已经不再能够适应当前与未来的信息处理流程,需要对个人信息的基本要素进行重建,其中最重要的是识别性要素的再认识。同时,对《民法典》中对个人信息保护的条款进
学位
随着移动互联网技术的飞速发展,各种网络应用层出不穷,在为人们带来便利的同时,也产生了海量的数据资源,使得人们面临选择困难的窘境。推荐系统从海量信息中筛选有价值部分,生成合适的策略进行推荐,很好地缓解了信息过载的问题。其中,序列推荐通过挖掘用户历史交互记录中有价值的顺序模式,为用户提供更加可靠的推荐,已成为当下研究的热点。然而,现有的模型大都关注用户序列单个层面的问题,对完整的多层面建模不足。基于此
学位
高分辨率图像对于日常生活和科学研究都具有重要意义。但是,由于硬件设备和外部条件的限制,很多时候难以获取满足需求的高分辨率图像。自从深度学习技术应用到图像处理领域以来,在各种图像处理任务中都取得不错的效果,随着深度学习技术的不断进步,基于深度学习的图像超分辨率重建技术在业界内受到广泛的关注。超分辨率技术可以从给定的低分辨率图像或者具有相关性的图像序列中重建出高分辨率图像。超分辨率技术是图像处理中的一
学位
自我国实施社会主义市场经济以来,我国市场与国际市场融合程度与日俱增,企业经营管理体系也愈发现代化。与此同时,许多“舶来”的企业管理制度在此过程中被引进,薪酬保密制度就是其中之一。所谓薪酬保密,就是一种禁止员工和其同事讨论各自劳动报酬的工作场所规则或薪酬管理制度。企业实施这一制度的根本目的在于,通过限制或阻断薪酬信息的传播以维护企业内部稳定和提高经济效益。然而,这项制度在为企业管理带来利好的同时,也
学位