神经网络阅读理解模型预测机制初探

来源 :南京大学 | 被引量 : 0次 | 上传用户:lzx6963817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让机器理解人类自然语言是人工智能领域一个长期的目标,其中如何衡量机器是否理解自然语言本身也是一个难题。作为智能问答的子任务,机器阅读理解是指给定一段非结构化文本和相应的问题,机器阅读文本后给出问题答案。因为机器解题过程中需要隐式完成很多自然语言处理中的底层任务才能给出正确答案,所以机器阅读理解任务非常适合用来评估机器对于自然语言的理解能力。无论在学术研究还是在实际应用中,机器阅读理解都有着重大的价值与意义。神经网络是目前机器阅读理解领域的主流方法,在很多基准任务上已经超越人类的水平。神经网络阅读理解模型虽然取得了不错的性能,但其端到端的训练方式导致了预测机制的不透明,依然存在一些问题未解决。其中部分问题具体表现为:1)在抽取式阅读理解任务中,不断删除问题中的词直到问题信息不充分时,模型依然能够预测正确答案,这一模型过稳定问题并不符合人类的直觉;2)在离散推理阅读理解任务中,当前主流数据集只给出最终答案,并未提供中间解题过程,导致了在计算类问题上模型预测公式的正确程度难以评估,同时在计数、排序等类型问题上模型预测机制不透明,难以判断模型是否真正通过计数、排序之类的符号推理能力预测答案。针对上述问题,本文对神经网络阅读理解模型的预测机制展开了初步探究,主要工作如下:●针对抽取式阅读理解任务中模型存在的过稳定问题,本文尝试从数据角度进行探究。首先提出了一种简单有效的指标衡量模型过稳定性程度,并基于提出的指标验证了该问题在抽取式神经网络阅读理解模型中普遍存在。接着通过加入与原问题字面相似但不可回答的问题一起训练,使得模型过稳定问题得到缓解,并且在对抗样本场景下鲁棒性更强。此外,本文还探究了问题长度、问题类型与模型过稳定问题的相关性。●针对离散推理阅读理解任务中模型在计算类问题上预测公式的正确程度难以评估以及计数、排序等类型问题上预测机制不透明等问题,本文基于当前主流数据集进行细粒度的标注,并通过标注数据对离散推理模型预测机制进行了初步探究,从标注数据中提取出正确的解题公式评估现有模型在计算类问题上预测公式的正确程度。同时,因为标注的数据包含详细的解题过程,也可以提供额外的监督信息帮助研究人员后续在计数、排序等类型问题上训练预测机制更加透明的神经网络模型。●为了提高离散推理阅读理解细粒度标注任务中标注人员的标注效率,标准化标注流程,减少标注错误,本文还设计并实现了一个标注系统。该系统主要包含账户注册、账户登录登出、待标注数据上传、待标注数据分配、已标注数据下载、数据标注、数据统计等功能,为标注人员提供了方便。
其他文献
血压变异性(BPV)是独立于血压平均值之外的脑卒中危险因素,但目前国内外指南对BPV尚未引起足够重视。患者住院期间是评估和管理BPV的最佳时机。因此,上海卒中学会组织相关专家拟定了"缺血性脑卒中住院患者血压变异性管理上海专家建议"。主要强调了减小BPV在急性缺血性脑卒中患者远期功能恢复及二级预防中的重要性,并对BPV的评估方法做出了推荐;同时关注了新型降压药物在脑卒中患者中的应用价值。
目的分析老年高血压患者短时血压变异性的危险因素。方法回顾性分析2018年12月—2020年3月期间大余县人民医院收治的60例老年高血压患者的临床资料,比较不同特征老年高血压患者短时血压变异性(舒张压变异性、收缩压变异性)情况,并分析可能导致老年高血压短时血压变异性的危险因素。结果病程≥3年、血脂异常、IMT增厚均是老年高血压24 h舒张压、收缩压血压变异性的独立危险因素(P<0.05)。结论老年高
学位
量子双体系统是量子信息与量子计算的基本量子体系,作为少体量子体系,其热力学与统计力学性质是至关重要的。我们研究了这样量子双体体系的非平衡热力学和统计力学性质,尤其揭示了其内在的演化规律和物理量相关规律。为此我们首先构建出量子双体体系的哈密顿模型,该系统的子系统为非平衡态的外驱系统,借助这样一个模型我们给出了双体系统下主方程的表述形式,也进一步得到了描述演化性质的转移率矩阵所满足的性质,这些结果与单
学位
市域社会治理现代化是国家治理现代化的重要组成部分,是国家治理现代化在市域范围内的具体体现。市域社会治理从概念提出到试点推进的时间非常短暂,它既存在理论支撑薄弱问题,又存在实践探索缺乏经验借鉴的问题。基于此,本文从市域社会治理的主体构成与功能定位、工作布局与职责界定、方式融合与技术支撑三个方面,试图弄清楚"谁来治理""治理什么""如何治理"三个结构性问题。推进市域社会治理现代化,一是理顺主体间关系,
量子计算,作为二十一世纪中的一项新热门技术,无论是在计算速度还是计算能力方面,它都是明显优于经典计算机。但是,量子计算在处理量子信息的过程中,相应的量子系统需要保持一种稳定的相干性,而这种相干性会因为量子体系与环境之间发生不可避免的相互作用而受到破坏。所以,如何创造一个无消相干子空间以克服消相干的影响已成为制造量子计算机的关键之一。本文主要研究了两种无消相干子空间:绝热子空间和芝诺子空间,我们首先
线上教育打破了传统意义上的学习方式,为中国高校教学改革带来了新方向。为适应互联网时代下新的教学方法,北方民族大学于2015年开始了首次线上教学的尝试,它是宁夏回族自治区第一所实行线上教学的高校。但是由于北方民族大学现有教学平台在个性化教学和智能化组卷考试方面功能不完善等原因,导致北方民族大学在线上个性化教学和智能化组卷考试方面产生了一些问题。为解决北方民族大学线上教学中存在的问题,实现线上教学系统
目的:非小细胞肺癌(non-small cell lung cancer,NSCLC)是肺部恶性肿瘤之一,病理类型多为肺腺癌和肺鳞癌,预后较差。Notch信号通路在机体发育中起着重要作用,研究表明Notch基因既是原癌基因又是抑癌基因,与NSCLC的肿瘤发生、发展和免疫耐受相关。近年,研究发现快速的有氧糖酵解保证肿瘤快速增殖的能量供给和生物大分子合成的原料供给,是肿瘤细胞的代谢特点之一。在前期研究
结直肠癌(colorectal cancer,CRC)是最常见的消化道恶性肿瘤之一,长期危害人类健康。《中国大肠癌流行病学及其预防和筛查白皮书》显示,中国CRC的发病率居恶性肿瘤发病率第3位。然而,与CRC发生发展相关的机制仍然不清楚。因此,寻求潜在的治疗标志物对提高CRC生存率有着非常重要的意义。本文通过癌症基因组图谱(TCGA)数据库分析发现位于人类7q31号染色体上的无翅相关集合位点家族2号
背景脓毒症是临床上发病凶险和致死率高的常见并发症。内毒素耐受是机体应对脓毒症的一种重要的内源性保护途径。丙酮酸激酶M2(pyruvate kinase M2,PKM2)是糖酵解途径的限速酶,PKM2有三种构型:单聚体、二聚体和四聚体。研究发现单核巨噬细胞在脂多糖(lipopolysaccharide,LPS)的刺激下,促进PKM2四聚体(位于胞浆)向单/二聚体(位于胞核)转变,通过诱导单/二聚体P