基于Yolo V4+Word2Vec的试卷问答题评分算法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:paokahh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在教育领域,问答题题型广泛用于各种考试中。以往针对问答题的自动评分研究吸引了大量学者研究,且大都面向电子版文档。而目前的作业、试题大都以纸质文档为主,故距实际应用较远。如何将问答题自动评分的方式方法应用到纸质对象的评阅中,还尚未有完整的解决方案,成为了自然语言处理在教育行业应用的重点和难点问题。在上述背景下,本文从教师的试卷批改工作入手,观察和调查教师的批改动作,根据改卷过程中的需求和计算机工作特点,确定了一个先检测、再识别、最后评分的三段式纸质试卷自动评分的算法框架。再以《系统建模与仿真》学科考试为研究对象,设计、制作和收集纸质试卷,组合运用目标检测算法、OCR文字识别API、问答题自动评分方法实现了一套针对纸质试卷的题目自动评分算法。针对本文应用场景,首先利用现有Yolo v4目标检测算法,自建试卷数据集,改进了目标检测的预处理和视频帧检测方式,实现了对试卷姓名栏、题目内容的目标检测;随后根据目标检测结果,搭建腾讯云OCR API实现了对检测结果的手写体识别;然后将含有维基百科、国内新闻、学科专业文本混合语料库,使用Word2Vec训练词向量模型,将词向量、句向量作为文本的特征进行相似度计算,并制定了问答题评分规则;最后,使用正则表达式、多线程等方法将Yolo v4、OCR、语义相似度评分算法三者连接。评测实验表明:改进图片数据增强方法的Yolo v4网络得到了68.77%的mAP50成绩和49.48%的mAP75成绩,使用“竖直平移”视频检测方案将试卷内容检测精度提高了21.25%,搭建的Word2Vec问答题相似度评分算法与专家评分均方误差在0.81以下,误差在10%以内。在测试中满足日常使用要求。本文成功实现了纸质试卷的问答题自动批改算法,研究成果对纸质对象的智能阅卷提供了理论依据和方法参考。提出的原型算法的实现证明了利用上述三种算法实现针对纸质试卷的问答题自动评分解决方案在理论和技术上是可行的,对减少教师工作量、提高教学质量有重要应用价值,对未来相关研究具有一定参考价值。
其他文献
焊接作为一种常用的加工方法,被广泛的应用在各行各业中。由于在焊接过程中容易收到外部环境的影响,这将会使焊缝表面出现凹陷、咬边、裂纹(表面)、电弧擦伤、破口残留等表面缺陷。目前在对焊缝表面缺陷检测中,传统的接触式检测方法存在着检测速度慢和容易划伤表面等不足;常用的非接触检测方法在检测复杂形态及大型焊缝表面时也存在着局限性;因此开展面向焊缝表面缺陷检测的电涡流传感器开发,以实现焊缝表面缺陷在线检测,具
板球系统可以看作是在二维空间中的球杆系统的扩展,作为一个多自由度的复杂系统,板球系统常常作为控制领域中理论研究的一种重要的实验对象,被用来验证各种控制算法性能。滑模控制是非线性系统控制中的一种常见的控制方法,特殊之处在于其控制过程中的不连续性。这种不连续性使得被控系统的状态在沿着轨迹做小范围快速上下切换运动,正是这种不连续特性使得滑模控制具备良好的鲁棒性,但使系统产生抖振问题。本文以板球系统为控制
在农业生产领域,玉米是我国重要的农作物,玉米苗期的除草能有效保障作物产量。目前国内的除草方式主要包括人工除草、化学除草和中耕除草等,这些传统的方法存在各自的缺点,比如除草效率低、劳动成本高、破坏土壤环境和造成化学污染等,因此,研究智能农业除草机器人的技术具有现实意义。视觉系统是智能除草机器人的一项基础且重要的研究任务,高精度和低延时的图像算法是完成识别的关键,现有的除草机器人视觉系统普遍使用传统图
在《中国制造2025》以及《“十四五”规划和2035年远景目标纲要》的政策背景下,加快我国传统制造业产业升级、深入实施制造强国战略、加快发展现代产业体系,目的是推动我国高新科技的发展。机械手在我国工业生产领域有着广泛应用,但是大多数机械手只适用于当下的工作场合,不能做到多种不同条件下的夹持。为此,进行机械手的夹持特性研究是十分重要的,为后期机器触觉的感知研究提供一定参考价值。柔性两爪机械手的接触状
有轨矿车作为矿业开采过程中的主要运输设备,承担着矿物和人员的运输任务。随着社会对矿物资源需求的增大,矿物开采量也不断增加,矿井环境恶劣,给矿车操作人员的身体带来了极大的危害,长时间的驾驶导致操作人员疲劳和精力不集中等问题增大了撞车的风险。本文结合目前先进的自动控制技术和环境感知技术设计了坑道环境下有轨矿车自动控制系统,来提高有轨矿车自动化程度以代替人工操作实现坑道环境下的矿物运输。本文基于西门子P
节约资源,优化资源利用率一直是可持续发展的重要内容之一,是绿色智能制造的重要组成部分。优化下料问题是指将小的零件在大的原材料上进行合理的几何组合,切割下料,确定下料排样方案,以使得材料利用率最高。因此,对优化下料问题的研究是一个具有重要经济意义和社会效益的问题。优化下料问题本身具有较高时间和空间复杂度,属非确定型多项式问题,又称NP难问题,一般情况下不存在多项式算法。近年来许多专家学者在从事与此相
国内某冶金公司电解分厂电解槽车间,其生产采用电解精炼的方式将火法精炼产出的阳极铜进一步提纯,并回收有价金属。生产过程中均采用人工手动操作桥式起重机完成极板的吊运工作,同时驾驶员需要与地面指挥人员对话来完成极板与目标电解槽间的准确对接,占用人力资源较多,为了实现对电解车间的远程监管、减员增效,同时实现本地桥式起重机自动定位控制以及监控中心对车间工况的远程监控等自动化功能,本文对该电解分厂电解槽车间的
工业机器人是一种高柔性的自动化设备,是智能制造系统的重要组成。虽然工业机器人拥有较高的重复精度,但是其定位精度较低,在一些需要高定位精度的领域仍然无法应用,标定技术可以提高机器人定位精度而无需改变其本身结构。针对现有标定技术中使用的测量设备价格昂贵,标定流程繁琐的问题,本文提出一种基于拉线传感器的运动学标定系统,该系统可用于快速标定机器人运动学参数误差、传动参数误差,并补偿到机器人名义运动学模型中
双目视觉避障技术是在结合双目视觉技术的基础上对环境中的障碍物进行检测,获取其位置信息,并根据得到的信息进行避障的技术,具有信息采集速度快、感知环境信息丰富、成本低等优点,该技术的研究成果可广泛应用于移动机器人、无人机等领域。在该技术中,如何从背景中准确检测出前景(障碍物)是研究难点之一。障碍物检测过程中,受地面影响,生成的视差图中会存在小区域噪声,而基于一般的图像二值化处理很难做到完全去除这些噪声
随着我国工业机器人产量不断提高,很多的人工作业逐渐被工业机器人替代。在蓄电池生产中往往会存在大量重复性高的码垛工作,人工码垛蓄电池在效率上已经不能满足现代生产需求,这些都为机器人码垛技术的发展提供了机会。由于不同厂家生产的铅酸蓄电池电池外观、尺寸并不相同,并且码垛时抓取数量不唯一,而且现阶段市面上的码垛设备功能较为单一,只能实现码垛过程的单一功能,没有适用于多种规格蓄电池的通用码垛设备销售。本文以