基于语义融合的英文自动短答案评分方法

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:bbandd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于信息技术的飞速发展,人工智能渐渐成为人们研究的主流方向。智能教学系统(Intelligent Tutoring Systems,ITSs)作为计算机辅助教学的一部分由于其便捷、智能等特点越来越受教学相关的从业人员的喜爱。对于传统的人工评分方法,一方面,需要耗费评分者极大的精力,给教师造成严重的工作负担;另一方面,还存在人为主观的因素影响评分质量,使得评分结果带有不公平性。渐渐地,越来越多的研究人员将对神经网络和深度学习的研究应用到各个方面。通过深度学习进行短答案评分,不仅可以有效地避免人为判卷时的主观影响,而且减少了教师的教学工作。自动短答案评分(Automatic Short Answer Grading,ASAG)是智能教学系统的关键组成部分。然而,ASAG的深度学习方法仍然存在以下两大挑战:(1)高精度评分要求评分者对答案文本有深刻的理解;(2)ASAG的语料库通常较小,不能为深度学习提供足够的训练数据。为解决上述问题,本文提出了如下两种基于深度学习的自动英文短答案评分方法:(1)提出一种基于多维嵌入的自动英文短答案评分方法,结合句法分析方法对文本语义进行深入理解。该方法以自然语言处理基本任务之一的文本匹配任务作为切入点对文本语义做深入理解,研究在不同的文本之间语义的关系。构建带有深层语义表示的方法抽取文本蕴涵的语义信息。先在Quora数据集上评估文本语义的理解程度,然后在扩充的Mohler数据集上验证带有语义理解的深度学习方法与不带有语义理解的深度学习方法之间的差异。(2)提出一种基于BERT(Bidirectional Encoder Representation from Transformers)的自动英文短答案评分方法,在保证文本的深入理解的同时解决在小语料上训练数据不足的问题。首先对于训练数据不足的问题,采用主流的预训练模型作为信息编码方法,为实现对短答案文本的深入理解,在BERT基础之上构建了一个由Bi-LSTM和胶囊(Capsule)网络组成的语义细化层,并提出符合短答案评分任务需求的triple-hot变种交叉熵损失函数取代初始的one-hot损失函数,在Sem Eval-2013数据集和Mohler数据集上验证模型效果。
其他文献
图神经网络算法在节点分类和边连接预测等任务上取得了很好的成绩,然而在图分类任务的效果还有很大提升空间。图分类算法可以分为两类,分别为图池化型图分类算法和节点投票型图分类算法。然而,当前图池化型图分类算法在池化时会损失很多特征和结构信息,并且其在生成图特征时没有考虑任务相关性,以至于生成的图特征表达能力不强,影响图分类的精度。当前节点投票型图分类算法无法让节点感受足够丰富的全局图信息,导致每个节点对
学位
随着新时代高速建设投资的持续增加,高速公路里程规模不断增加,大修工程也随之同步增多。为满足新时代高速公路发展的基本需求,强化大修工程的综合质量管理水平,以“使用性能评价——使用性能预测——使用效益评价”为技术思路,开展了高速公路大修工程路面后期评价体系研究,为未来高速公路大修工程和改扩建工程的科学决策与投资提供依据。
期刊
目的:观察罗沙司他、罗沙司他联合促红细胞生成素(EPO)治疗维持性血液透析患者肾性贫血的临床疗效和安全性。方法:收集贵州医科大学附属医院、贵州省人民医院、贵州医科大学附属白云医院肾内科2020年5月至2021年12月收治的维持性血液透析伴肾性贫血患者90例,分为3个组:EPO组(A组)、罗沙司他组(B组)、罗沙司他联合EPO组(C组),每组30例。分别检测三组患者治疗前及治疗后第4、8、12周的血
学位
目的 探讨天麻对脑缺血后星形胶质细胞损伤是否具有直接保护作用及Cathepsin B-Caspase信号通路与天麻保护细胞的作用有无关联。方法 建立动物缺血性脑中风模型,缺血再灌注28 d,随机分为假手术组、模型组、天麻低剂量(50 mg/kg)组、天麻中剂量(100 mg/kg)组、天麻高剂量(150 mg/kg)组,天麻各剂量组每天给予不同剂量的天麻,假手术组给予同体积的溶剂,28 d后观察各
期刊
天麻是我国的名贵中草药,在防治阿尔茨海默病、卒中、改善记忆、延缓衰老等方面具有较好的功效。天麻素作为天麻的主要生物活性成分,自被提取鉴定以来,其药理特性得到广泛研究,尤其是在中枢神经系统疾病的研究中表现出了很好的治疗潜力。但由于脂溶性差、活性不高且容易代谢的缺点,很大程度限制了天麻素的应用。因此针对天麻素的结构进行改造优化,以开发出更优活性的衍生物。本文主要综述天麻素及各衍生物抗痴呆症的作用,并分
期刊
近年来,云计算技术发展迅速,大量云服务商为用户推出云存储服务。这些云存储服务满足了用户对跨平台多终端的文件存储、备份和共享的需求,给用户带来了较大便利。由于网络安全形势的日益严峻和人们的隐私保护意识逐渐增强,因此用户将图像等多媒数据上传到云端之前,往往对它们进行加密处理以保护隐私信息。随着云端的密文图像数量日益增多,如何对密文图像进行有效管理和应用成为云服务和信息安全领域亟待解决的问题。为此,研究
学位
地震波形信号的准确分类在地震目录的清洗、地震实时监测以及地震预警方面有着重要的意义,是地震学进一步深入研究的基础。传统地震信号分类往往通过选取有代表性的地震波形特征信息进行识别,只关注所选特征的相关信息,忽略了原记录地震波形所蕴含的更多其它信息。深度神经网络拥有自动提取特征和自学习的优点并且在许多分类问题尤其是图像分类识别上取得了显著的成功,因此可以运用深度学习挖掘地震波形所蕴含的丰富信息,根据不
学位
目的:1、探讨血小板参数在RA中的应用价值;2、探讨抗环瓜氨酸肽(CCP)抗体、类风湿因子(RF)、抗RA33抗体、C反应蛋白(CRP)、红细胞沉降率(ESR)联合检测在RA诊断中的应用价值。方法:选取2020年11月~2021年12月贵州医科大学第三附属医院风湿免疫科门诊及住院患者155例为RA组。非RA风湿病患者68例(强直性脊柱炎20例、骨关节炎17例、系统性红斑狼疮20例、干燥综合征11例
学位
学位
研究了水泥混凝土路面抗折强度的检测方法,通过对模拟水泥混凝土路面中钻取的芯样试件进行抗压、劈裂抗拉及抗折试验,获得芯样抗压、劈裂抗拉强度和水泥混凝土抗折强度。以芯样抗压、劈裂抗拉强度为自变量,水泥混凝土抗折强度为因变量,采用最小二乘法对试验数据进行回归拟合,给出相应的芯样抗压、劈裂抗拉强度推定水泥混凝路面抗折强度换算曲线(即测强曲线);同时从不同角度比较了2种方法的检测精度。结果表明:芯样抗压与水
期刊