论文部分内容阅读
在传统的考试场景中,由老师设计题目,考生作答,最终再由老师进行批改,整个过程中最为繁琐的便是人工阅卷的环节。人工阅卷不仅给老师带来繁重的工作量,而且容易出现批改错误、阅卷周期长的问题,对教学带来不利的影响。随着计算机技术的发展,答题卡中选择题填涂结果的自动识别技术已经被广泛应用。而主观题部分,由于涉及到图像手写文字检测、识别和理解等复杂问题,仍然依赖于人工批改。考生手写文字与试卷本身的印刷体文字分布在同一张图片中,检测时需要做出准确的区分,同时需要检测出文字所属的题目类型,以便后续按照不同的题目类型使用不同的批改策略。此外,不同考生的笔迹各不相同,文字或紧凑或稀疏,使得文字检测识别面临较大的挑战。本文针对相邻文本行难以区分、相邻相同字符识别易出错以及题目类型多样等问题与挑战,提出了一种基于语义分割的多题型手写文本检测算法以及一种基于循环神经网络的图像手写文字识别算法,并以此为基础设计实现了一种适应不同题型的批改算法。首先,本文在现有的真实小学数学考试答题卡图像数据以及相关公开数据集上构建了用于文本检测、文本识别的数据集;其次,本文研究实现了文本检测、文本识别和自动批改等相关算法,并使用本文数据集训练、测试了相关算法。本文使用提出的小学数学考试文本检测、识别数据集,分别对手写文本检测、识别算法进行了相关对比实验以及消融实验,并测试了整体的自动批改算法,结果表明了本文方法具有较高的准确率,具有一定的实用价值,符合预期的研究目标。