深度学习在英语考试自动评分中的应用研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:gz200009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能在教育领域的不断发展,各种能够提高工作效率的方法层出不穷,尤其是自动评分系统的出现,更加减轻了老师工作量。现在已经取得广泛应用的是客观题自动评分,而主观题评分因为复杂且困难一直是教育人工智能领域的研究难点和热点。英语阅卷工作量较大,且英语主观题存在中英文两种题目类型,因此研究英语考试自动评分具有重要意义。主观题自动评分算法的核心问题是文本相似度研究,而深度学习因为在特征提取方面的优势,在自然语言处理领域中的应用越来越广泛,运用深度学习知识将文本内容用特征向量表示,用向量的距离来判断文本对的相似度。本文在提出使用卷积神经网络衡量文本相似度时,不仅使用多尺度卷积提取文本局部基础特征,还研究使用双通道卷积模型提取文本多粒度特征,在此基础上,将双通道提取出的特征进行交互。在使用循环网络模型衡量文本相似度时,研究在双向GRU模型中融入注意力池化和自注意力的模型。本文的主要工作和创新点如下:首先,研究使用多尺度卷积提取文本特征,使用尺度不同的卷积核,获取不同尺度丰富的文本语义信息。解决了单一尺度获取局部信息时语义丢失的问题。又提出一种基于词粒度和字粒度的双通道卷积神经网络,两种粒度的文本表达使得文章更深层次的信息被挖掘。使用两种粒度的文本表征矩阵,学习两个通道的不同粒度语义的相似特征,通过交互后的语义相似矩阵判断文本相似度。其次,研究在双向GRU模型的基础上分别融入自注意力机制和注意力池化。自注意力机制不仅能捕获远距离文本信息,解决了远距离信息丢失的问题,还能捕捉同一句子中不同单词之间的相互作用。注意力池化可以通过文本之间的交互作用,捕捉文本对之间相互影响的信息,获取不同词之间影响程度。双向GRU模型用来处理时间序列的文本信息时,能获取句子的前向和后向语义信息。最后,对本文提出的方法模型进行实验分析,对比使用基于卷积神经网络和循环神经网络两种模型的效果。本文的语料集有中英文两种,针对这两种不同的语料集,采用的预处理方式也不相同。实验数据表明,循环神经网络在短文本数据集中效果较好,证明融入注意力池化的网络,因能够获取文本之间的相互影响而使得文本特征表示更全面,在研究文本对的相似度时模型效果更好。
其他文献
为了帮助下肢有行走功能障碍的患者进行康复训练,本课题以康复型下肢外骨骼机器人作为研究对象,采用理论分析、模拟仿真、样机试验等方法,设计了一款穿戴舒适性良好、安全性能高的外骨骼机器人。并基于穿戴舒适性中的界面舒适性设计了相关实验,验证了人-机界面装置具备穿戴舒适性,具体研究内容如下:(1)根据外骨骼机器人的功能要求与舒适性要求,对人体下肢运动机理进行分析,建立了舒适性评价机制;完成了下肢外骨骼机器人
随着纺织行业的飞速发展,合成纤维产量逐渐增加,已达到全球超七成的总产量比例,纺织行业迫切需要智能化和数字化的转型升级。本文针对传统半自动化落卷生产线作业效率低、功耗大和易损坏丝饼等问题,以双轴落卷机为研究对象,研究开发了基于改进蚁群算法实现调度的自动落卷输送控制系统。该输送控制系统由输送调度系统和落卷机控制系统两部分组成,经过现场多次连续运行与调试验证,相对于传统先来先服务的作业方式,总行驶里程降
失能人群是指在生活方面丧失自理能力、需要护工对其饮食起居进行照顾的人群。然而,随着人口老龄化速度加快,失能人群的数量不断增加,现有护工数量已无法满足失能人群的需求。在衣食住行中,“食”属于失能人群最基础的需求,因此,用助餐机器设备改善人力资源不足,具有很大的研究意义。现有的助餐机器人的交互方式对使用人群、使用环境等方面有一定的制约,在设计概念与技术实现上常存在脱节问题。因此拓宽现有智能助餐机器人的
自动驾驶技术可以提高驾驶安全性,减少人员伤亡与财产损失。在自动驾驶过程中首先需要对车辆周边的驾驶环境进行感知,其中通过车载相机采集图像是一种重要的感知方式。但在低照度环境下采集的图像的质量容易发生下降,进而会影响自动驾驶的安全性。为此,本文展开了基于深度学习的低照度车辆检测方法的研究,对深度学习低照度车辆检测相关理论展开调研与研究,设计基于深度学习的SEnlighten GAN低照度图像增强模型实
在新媒体的技术发展和传播背景下,以传统印刷纸媒为主的时尚杂志开始向数字化方向转型。新媒体视域下时尚杂志的视觉信息,包括结构型信息和体验型信息,主要基于微博、微信和移动客户端APP。现有研究中,对时尚杂志视觉信息的系统性和实证性研究尚为少数。本文以国内时尚杂志在微博、微信、移动客户端APP中的视觉信息为研究对象,综合运用资料分析法、内容分析法、比较研究法、跨学科研究等方法,梳理了时尚杂志由纸媒向数字
随着人工智能行业和大数据技术的发展,人们对于生活工作效率的要求不断地提高;而随着科技的进步,越来越多的商家开始在网络上进行服装的买卖,也相应有越来越多的买家在网络上进行服装的展示,互联网上存储着海量的服装数据,用户对时尚服装也越来越重视,时尚也成了人们热议的话题。而实际生活中时装相关的图片,衣服由于一些客观因素会产生难以避免的变形或者掩盖,商用的服装图像风格也是各有不同。在生产部署中,对于服装类图
随着航天技术研究的不断深入,航空航天获得了高速蓬勃的发展。它对我国的经济、领土安全以及日常生活有着十分重要的意义。随着科技的不断进步以及航天技术的不断发展,人们越来越重视研究人员的健康以及环境保护的问题。推进剂是运载火箭动力推进系统的动力源,而我国的推进剂多以肼类推进剂为主。硝酸羟胺(HAN)基推进剂没有污染,毒性小而且密度比冲较大,是一种绿色推进剂,是肼类推进剂的理想代替品。为了探究HAN基在何
多智能体编队控制广泛应用于无人机编队协作、传感器网络、数据融合、交通车辆控制等领域,可进行军事巡逻、能源勘探、地图绘制、协同救援等工作。多智能体编队控制是指通过分布式协同控制方法,使得多智能体系统形成期望队形,并在期望队形上保持稳定。针对上述问题,本文采用偏微分方程(PDE)建立多智能体系统的集群动力学模型,描述包含智能体之间交互关系的系统整体动力学特性。运用无穷维Backstepping方法设计
伴随互联网浪潮推动相关行业朝着工业智能化、信息数据化飞速发展,各行各业产生并积累了海量数据,其数据量呈现出了指数级的上升趋势,信息时代步入了大数据时代。作为大数据研究的重要分支,时序数据分析能够获取系统运行中的关键信息,在各行业中具有广泛应用前景,在国内外相关领域研究中受到了诸多关注。突变点检测技术能够从整体数据快速定位到突变点,根据突变点位置信息分析数据波动原因。由于传统的数据流突变点检测技术在
无线传感器网络是一种能够通过传感器节点实时获取区域信息并对传输回来的信息进行一定处理的自组织网络。传感器节点具有一定的信息采集、传输和处理能力,由于其体积较小,成本低廉,电池能量有限,在网内节点数目往往较多,节点随机均匀地分布在感知区域内,通过对节点采集到的信息进一步分析,能实现对区域环境的监测。传感器网络在获取信息的实时性有着无与伦比的优越性,且无需提前搭建基础设施,被广泛地应用于医疗、环境等各