【摘 要】
:
自动作文评分(Automated Essay Scoring,AES)是自然语言处理(Natural Language Processing,NLP)在教育领域的典型应用。近十几年来,随着全球化的发展和语言教育的普及,用于考察语言掌握能力的作文评分需求也进一步扩大。由于传统的人工评分方式耗时耗力,难以满足日益增长的需求,所以自动作文评分技术应运而生。现有自动作文评分技术主要关注两大类场景:同提示作
论文部分内容阅读
自动作文评分(Automated Essay Scoring,AES)是自然语言处理(Natural Language Processing,NLP)在教育领域的典型应用。近十几年来,随着全球化的发展和语言教育的普及,用于考察语言掌握能力的作文评分需求也进一步扩大。由于传统的人工评分方式耗时耗力,难以满足日益增长的需求,所以自动作文评分技术应运而生。现有自动作文评分技术主要关注两大类场景:同提示作文评分(待评分作文与已有带评分历史作文来自同一个作文提示),跨提示作文评分(待评分作文与已有带评分历史作文来自不同的作文提示)。在两类场景中,同提示作文评分场景相对比较容易,它所对应的模型训练数据和测试数据分布比较一致,目前已经取得了不错的进展。而跨提示作文评分场景虽然更有实用价值,但它所对应的模型训练数据和测试数据在作文主题(写作内容)、考试难度级别、分数范围、写作体裁等方面都可能会存在差异,这给作文评分模型的设计带来了很大的挑战,目前对该场景的研究还不够深入。本文主要针对跨提示自动作文评分场景从两个方面进行了研究:一方面,针对模型训练数据与测试数据在作文主题上存在差异的特点,研究对作文对提示敏感的跨提示自动评分模型;另一方面,针对模型训练数据与测试数据在考试难度级别和分数范围上存在差异的特点,研究基于小样本学习的跨提示自动评分模型。具体而言,本文的主要工作如下:1.提出了一种对提示敏感的跨提示自动作文评分模型。现有的跨提示自动作文评分方法通常仅根据作文的写作质量来对作文进行评分,这忽略了作文的扣题程度对分数的影响。为了解决这个问题,本文提出了一种对提示敏感的跨提示自动作文评分模型PANN。具体说来,该模型包含两个子网络来分别捕获作文的写作质量特征和提示匹配特征,从两个角度来对作文进行综合打分。此外,本文还设计了三个弱监督的预训练任务来强化两个子网络的学习能力。最后,通过在两个公开数据集上进行实验,实验结果验证了PANN的有效性。2.提出了一种基于小样本学习的跨提示自动作文评分模型。现有的跨提示自动作文评分方法针对的评分场景通常仅使用与带评分作文相同难度级别和分数范围的作文集合进行模型训练,但这种场景会使得一些作文考试中的缺少同难度级别样本用来训练的作文无法有效的被自动评分。为了处理这个问题,本文提出了一种基于小样本的跨提示自动作文评分模型TGBN。其主要思路是利用基于图的直推式学习方式来充分利用少量有标记样本和大量无标记样本之间的流形结构,实现在目标作文集合中的分数对齐。具体来说,该模型包括作文编码器、图卷积模块以及有序分类器三个主要部件,分别用来抽取文本特征、流形结构特征以及考虑类别有序性的分类。此外,为了能充分的利用历史作文数据集,该模型采用元学习中的“段”式训练策略来从历史不同难度级别和分数范围的作文集合中训练模型,以在目标作文集合上达到快速适应。最后,通过在两个公开数据集上进行实验,实验结果验证了TGBN的有效性。
其他文献
城市和工业污水中过量的含氮物质对生态环境和人体造成危害的问题越来越受到关注,随着对水体环境质量要求越来越高,总氮指标也纳入了管控,因此研究更为有效的尾水脱氮处理技术变得更为重要。电化学技术由于具有操作简单、设备体积小、水力停留时间较短等优点,已经在含氮污水处理领域获得实际使用,但存在电流效率较低的问题。本研究选用了具有氧化氨氮能力较强的阳极、高效脱硝能力的阴极和催化活性高的粒子电极,从而开发出一种
硅基电子芯片是现代信息技术的基石。伴随着信息时代的发展,人们对计算机性能和通信网络传输速度的要求都越来越高。传统电子芯片在抗干扰、损耗等方面呈现出越来越多的限制,无法满足日益增长的信息传递需求。光通信已成为通信发展的必然趋势。硅基光子的相关元器件由于其制作价格低廉,且易于与电子芯片实现集成,拥有巨大的发展潜力。作为硅基光子器件的重要组成部分,硅基定向耦合器因为其结构简单、易于加工等优点被广泛应用于
高校科研经费不仅仅是提高我国科技创新能力和促进科学技术进步的物质基础,同时也是高校科研工作的一项基本保障。但是,其管理模式造成了经费管理不到位、使用效率偏低和经费腐败等一系列问题,与此同时,随着科研经费投入的急速增大,科研经费转化率偏低的问题日益严重。因此,对科研经费进行合理利用、科学管理,从而提高其使用效率,使其发挥最大的效益是高校需要考虑的重要问题。本文以山东高校群为例,结合近年来山东省高校科
当前较少有对未使用和被废弃的汽车橡胶轮胎中有机添加剂浓度水平、潜在释放能力的评估,其中大部分研究是分析采集的环境样品,或者仅研究未使用的轮胎或二手轮胎,这都难以了解有机添加剂在新旧轮胎中的差异和对环境的贡献。因此本文对目前市场上占有量较大的未使用的新汽车轮胎和被废弃的旧汽车轮胎进行研究,以便了解有机添加剂在汽车轮胎中的浓度水平和使用情况。并且通过“颗粒–水–吸附剂”的脱附培养装置,将轮胎颗粒样品置
有机电致发光器件(OLED)由于具有自发光、使用有机材料等特点,在轻薄性、响应速度、成像效率和可柔性显示等方面性能凸显,市场渗透率逐年增长。发光材料是OLED的关键,其中磷光铱(III)配合物凭借效率高、结构易修饰、颜色可调节等优势,在众多发光材料中脱颖而出。但是在载流子传输不平衡、激子局部浓度过高等因素影响下,OLED器件普遍面临着效率滚降严重的问题。针对这一问题,本文从辅助配体的结构入手,设计
根据国际电信联盟的报告,在大规模机器类型通信(Massive Machine-Type Communication,mMTC)场景中,第五代移动通信技术有望支持大量的机器类设备进行通信并发挥重要作用。这些mMTC场景包括但不限于环境感知、智能电网、电子医疗等等。但是,机器类通信本质上不同于当前的人对人通信,海量的设备数目、小数据包传输、短时间内突发大量接入、有限的能耗以及多样化的服务质量(Qual
多目标多决策问题在决策过程中由于信息的不确定性仍存在一些问题,为解决此类决策问题,将三角函数引入模糊层次分析法,并利用三角模糊矩阵替换传统模糊矩阵,得到权重模型;同时还在双枝模糊层次决策分析模型中利用模型层次对因素进行划分,结合模糊相似关系理论确定了新的相对优属度矩阵构建方法;最后结合FAHP和D-SPA,得到D-SPA-FAHP综合评价模型,并以西部地区工业企业经济效益评价为例,计算得到其综合排
本论文通过查阅张家港市相关资料,同时在全市水稻种植区域布置多个研究点位,采集相关数据,分析张家港市优质稻米产业化开发现状,寻找张家港市优质稻米产业化开发过程中的相应问题并根据实际情况提出相应的解决措施,主要研究成功如下:1、张家港市优质稻米产业化开发现状张家港市主要以水稻种植为主,播种面积稳定在24万亩以上,历年水稻总产量均保持在14万吨以上。自2011年张家港市开展高标准农田建设起,以每年2.7
作为战争私有化的表现形式之一,私营军事安保公司一般活跃在局势不稳定的高风险地区,自出现起就与武装冲突、侵犯人权等相联系。随着多起私营军事安保公司雇员侵犯人权却难以被追责的情况发生,国际社会逐渐意识到,目前国际法乃至国内法层面均缺乏对私营军事安保公司的有效追责机制。论文从国际法对私营军事安保公司的传统规制困境出发,讨论当前的国际法对私营军事安保公司的直接与间接规制路径,并分析有关私营军事安保公司国际
作为一种新型的复合材料,碳纤维复合材料层合结构具备许多传统材料所不具备的优点。但由于制造工艺缺陷和运输碰撞等原因,导致层合板内出现各种损伤,脱层是复合材料层合板主要结构损伤形式之一。本文侧重对含损伤复合材料层合板梁屈曲失效机理进行实验研究。通过压曲实验,详细研究脱层的大小、深度和数量对复合材料层合板梁的屈曲及后屈曲力学行为的影响,同时进行有限元仿真,将有限元结果与实验结果进行对比。本文主要研究内容