【摘 要】
:
当前社会,随着线上线下教育市场的不断拓展,各类考试的需求不断增加。然而,传统人工阅卷方法由于成本高、耗时长、统计慢,已无法满足现代社会需要。虽然,客观题的自动阅卷技术已非常成熟并得到普遍应用,但由于自然语言处理复杂的汉语技术难度大,在主观题阅卷的处理上还是有许多不足。例如没有考虑语义、语序等问题对评分精度的影响。同时,由于实用性、模型评分过程可见性等问题,目前还没有大规模的中文主观题阅卷系统开发落
论文部分内容阅读
当前社会,随着线上线下教育市场的不断拓展,各类考试的需求不断增加。然而,传统人工阅卷方法由于成本高、耗时长、统计慢,已无法满足现代社会需要。虽然,客观题的自动阅卷技术已非常成熟并得到普遍应用,但由于自然语言处理复杂的汉语技术难度大,在主观题阅卷的处理上还是有许多不足。例如没有考虑语义、语序等问题对评分精度的影响。同时,由于实用性、模型评分过程可见性等问题,目前还没有大规模的中文主观题阅卷系统开发落地。针对以上问题,本文以物流专业真实考卷为样本,提出并实施了两种技术路线,为主观题自动评分系统提供算法支持。1、基于文本相似度的主观题自动评分模型。为了解决物流专业主观题评分问题,本文采用孪生网络模型和命名实体识别的方法,进一步通过模型融合对主观题进行判分。基于孪生网络的文本相似度匹配模型可确保结果准确性,同时基于命名实体识别的得分点识别模型可以提取学生答案与标准答案的得分点序列并进行匹配,通过模拟人工评分的方法,依据具体得分点对结果作出合理解释,命名实体识别方法也能有效提升模型计算效率和长文本匹配效率。2、基于知识图谱的主观题自动评分模型。为了解决基于文本相似度的评分模型在对专业类名词解释题评分时,效果不佳的问题,本文提出了基于知识图谱的主观题自动评分模型。利用物流专业的语料库和公开知识图谱构建共计5314对三元组,并通过知识嵌入模型进行训练。通过知识图谱可以快速有效的获取到知识之间的扩及关系,对语义有较好的表示与融合,因此适用于专业名词解释类等题型。本文对基于两种不同方法的主观题评分模型分别进行了训练和结果比较,对于基于文本相似度的主观题自动评分模型:训练后的得分点识别模型loss值在0.9左右收敛,模型准确率为80.54%,训练后的文本相似度匹配模型准确率为86.99%,融合后的模型单个用例得出评分时间在0.8s以内,基于简答题的测试数据均方误差为0.85,基于名词解释题的测试数据均方误差为1.61;对基于知识图谱的嵌入模型,训练后的MRR值为0.3582,Hits@10为0.3685,在名词解释类题型测试数据上的均方误差为0.45,表现明显优于基于文本相似度的主观题评分模型。本文进一步在上述算法研究基础上搭建了主观题自动阅卷系统,为教师角色、学生角色及管理员提供了相应的操作界面和系统展示。
其他文献
感知是自动驾驶的基础和关键,但大多数单个模型无法同时完成交通目标、可行驶区域和车道线等多项检测任务。提出了一种基于交叉注意力的多任务交通场景检测模型,可以同时检测交通目标、可行驶区域和车道线。首先使用编解码网络提取初始特征。利用混合空洞卷积对初始特征进行强化,并通过交叉注意力模块得到分割和检测特征图。在分割特征图上进行语义分割,在检测特征图上进行目标检测。实验结果表明,在具有挑战性的BDD100K
缓冲区的确定关系到整个地铁施工项目的时间进度。目前,国外和国内学者对研究关键链技术的兴趣较浓厚,而对缓冲区的确定方法仍缺乏进一步深入。通过分析前人研究的内容,结合地铁施工项目实际进展提出与进度吻合的缓冲区确定方法。首先,结合分段模糊工期研究缓冲区时间大小;其次,考虑不确定影响因素计算资源综合约束系数;最后提出符合地铁施工项目的缓冲区确定方法,并通过案例对提出的方法进行说明。
目的:探讨慢性肾功能衰竭(CFR)四证型(脾肾气虚、脾肾阳虚、肝肾阴虚、阴阳两虚型)脉图参数的变化,建立各证型判别式,辅助临床诊断。方法:采用ZM-Ⅲ型智能脉象仪分别检测CRF患者四型脉图参数。结果:脉图参数h1、h3、h3/h1、w/t及As值肝肾阴虚型最高,脾肾气虚型最低,脾肾阳虚、阴阳两虚介于二者之间;并建立了四证型函数判别式;将所测数据进行组内回代检验,脾肾气虚判别正确率为70%,脾肾阳虚
<正>归纳推理意识,是由个别性知识推导出一般性结论,由个性案例总结出普遍性规律的意识,是一种十分重要的数学思维,也是学习数学知识、开展数学实践的前提和基础。因此,在小学数学教学中,教师应该重视学生归纳推理意识的培养,使学生在归纳推理中形成数学概念、建立数学模型、探索数学规律、提升数学素养。在本文中,笔者结合个人的学习成果与工作经验,针对培养学生归纳推理意识的途径与策略展开研究与探索。希望通过本文的
随着我国城市建设快速发展以及人民生活条件不断提高,建筑能耗的总量及其所占全国能源消费总量比例都在逐年升高。该文以适宜我国夏热冬冷地区居住建筑围护结构低能耗设计为目标,参照德国被动房的参数标准及我国现行设计标准,通过无热桥、被动式门窗及遮阳系统、气密性三方面设计策略,探索建筑围护结构被动式节能设计方法。对我国被动式建筑设计以及现有建筑亟需存量更新状况及未来发展提供新的途径和方法。
自2018年起,国家开始对房地产行业进行频繁调控,出台了一系列的收紧政策,致使房地产行业信用风险逐步显露的同时,行业信用风险出清与行业整合也进一步加快。因此对一系列政策出台的背后其调控效果如何、调控后房地产行业的信用状况如何、信用状况是否符合政策调控预期以及房地产行业在政策调控下所表现出的新现象与所面临的新挑战等进行测度与分析具有重要意义。文章首先对2018年至2021年房地产行业的运行方面进行了
目的 借鉴美国核化生应急医学救援建设先进做法,为我国核化生应急医学救援力量建设提供参考和启示。方法 通过情报调研、专家咨询等方法,梳理分析美国核化生应急医学救援力量体系构成和建设特点。结果美国建立了军地一体的核化生应急医学救援力量体系,具备分级建设、分区部署、分工明确、模块建设、军地共建等5个特点。结论 建议通过对接建设标准、强化联合演训、统筹力量布局、协调专业整合等措施,推进我国核化生应急医学救
本文探讨地方政府失业目标调整对企业就业质量的影响。以2870份市级政府工作报告中计划失业率测量政府失业目标,以企业冗员反向测量就业质量,研究发现:更宽松的失业目标调整会降低冗员,提升就业质量;这种调整影响存在非对称性,企业对失业目标的上调更为敏感,会显著降低企业冗员,但下调影响并不显著,这说明调整影响更多来自政府导向下的企业主动行为。本文也发现失业目标调整的影响在民企、补贴较少的公司和市场化程度高
目的 讨论慢病管理模式在原发性高血压控制中的作用。方法 选择2018年1月至2021年1月襄阳职业技术学院附属医院收治的原发性高血压患者100例,随机分为实验组和对照组,对照组采用常规门诊管理,实验组在此基础上接受专科人员开展的慢病管理模式。结果 干预一年后,实验组的血压控制率、用药依从性、生活方式改变、自我管理能力等方面均优于对照组(P<0.05)。结论 对原发性高血压患者采用慢病管理模式,有利