中文论述题自动评分系统的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:z85811936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着人工智能技术的发展,越来越多的领域开展了自动评分方面的研究。中文论述题评分是考试自动评分中较为重要的一个领域,人工评分过程往往要耗费较多的人力资源,并且不能完全保证公正性,而设计实现一个完备的中文论述题自动评分系统将有效解决这几个问题。目前自动评分在中文论述题领域方面的技术仍然不够成熟,存在着准确度低、适用性窄等较为普遍的问题,中文论述题因为判分过程较为复杂,无法用简单的自动评分系统进行有效的评分。结合我国现有中文论述题评分系统,对评分过程及方法进行分析,最终采用提取特征项的方法,从深层语义、浅层语义和论述充分性的角度设计并提取了特征项,将得到的特征项合并成数据集并采用机器学习模型进行特征融合。选用了线性回归模型、支持向量回归模型和随机森林模型等方法进行了实验训练和评分结果的对比,在实验过程中通过调整相关的系数进行测试和优化,从评分效果的角度出发,最终选择了支持向量回归模型进行训练获得评分模型,通过实验对得到的评分模型进行了有效性验证,经过实验测试,评分模型计算得到的评分结果具有较高的有效性。对论述题自动评分的实际需求进行梳理和分析后,以得到的评分模型为基础设计并实现设计了完整的中文论述题自动评分系统,从多个功能模块对系统功能进行了详细的介绍,并且对实现的系统进行了测试,测试结果表明评分系统有着较为不错的自动评分效果,能够较好的满足论述题自动评分的相关需求。
其他文献
随着人口老龄化问题的加剧,阿尔茨海默症带来的社会问题日益严峻,尽早诊断与干预治疗具有重要的社会意义与经济意义。近年来,基于机器视觉的阿尔茨海默症识别算法发展迅速,但是仍然面临缺乏大规模训练数据集、算法精度不高以及运行效率较低等问题。本研究旨在基于深度学习改进卷积神经网络(CNN),提高阿尔茨海默症预测算法的精度与效率。针对目前2D CNN未能利用MR图像的三维特性,提出一种三方向2D CNN识别网
学位
互联网高速的信息产出对信息检索技术提出了更高的要求,促使人们在获取信息时从传统的搜索引擎式检索系统转向更为友好的智能问答系统。知识图谱的出现使得结构化的知识数据的存储和理解变得更加便利,从而推进知识图谱问答系统在各领域的应用。在医疗领域,时值2020年新型冠状病毒肺炎疫情全球性爆发,医疗相关知识获取需求凸显。为了满足用户对新冠医疗领域知识获取的需求,设计并实现了基于知识图谱的新冠医疗问答系统。在内
学位
新闻是自然语言处理领域中重要的研究对象之一,从海量新闻中挖掘出内容相关的新闻进行推荐有助于提高用户的阅读体验或用于相关新闻内容分析。对新闻进行特征建模时,传统的文本编码器难以保留长文档中丰富的语义信息和句法结构,因此,文档的图表示法被提出用于发现长格式文档的潜在语义结构。然而新闻文档通常含有复杂的语义交互信息,如何将多样的语义信息建模成网络的表示形式,并从中学习有效地表征用于相关新闻推荐系统是具有
学位
车道线检测作为各类智能安全驾驶辅助系统的核心技术,经过大量研究人员在该领域的研究,已经取得比较显著的成效。但是现有的各类车道线检测算法在各类车道干扰因素如光照不足,阴影遮蔽,车道路面结构的突变等影响下会出现检测车道线不完整以及将车道裂缝当作车道线的误检问题。因此,设计一个在复杂环境下也可以良好检测车道线的算法有着确切的应用意义。对复杂环境下车道线特征进行研究并结合目标检测的方法,提出一种可以自适应
学位
计算机技术在软件方面的发展离不开大量的编码,这些源码许多都能够通过互联网方便获取到。虽然这方便了大家对编程的学习,却也导致在编码上存在大量抄袭行为。因此,方便、有效、快捷的代码抄袭检测方法在当前的时代背景下就显得尤为重要。传统的代码相似性检测方法大多利用程序的属性或结构信息,随着时间的推移,对属性的选择和统计越来越纷杂,对结构的分析也越来越复杂。对相似度检测方法的设计者来说,选择哪种属性和结构信息
学位
在如今的大数据时代,面临与日俱增的计算需求,分布式计算已经成为了各大领域中的研究热点。大量的计算需求往往包含着庞大的计算逻辑,将这种计算需求进行分解得到的众多小的计算任务时,可以利用分布式任务调度框架将这些计算任务分配到各计算节点中,实现任务的并发处理。将这个庞大的计算逻辑模型化为一个工作流,计算逻辑中众多的计算任务视为工作流中环环相扣的阶段。因此,设计出一个处理这种工作流的分布式任务调度框架则显
学位
互联网应用在近些年取得了飞速的发展,随之而来的是海量的数据,这些数据的治理给企业带来了许多的挑战。数据质量管理作为数据治理的重要组成部分,主要用于保证相关数据满足预期的使用目标,有效的数据质量校验能够为企业避免巨大的损失,数据质量的相关研究正在引起越来越多的人们的重视。数据质量校验系统是数据高质量的重要保证。一方面,传统数据质量校验系统对校验规则采用硬编码的方式,这有很大的局限性,修改校验规则需要
学位
人脸识别系统将从摄像头读取到的人脸图像与事先存好的标准人脸进行比对,我们把存储标准人脸图像的库称为原型图像库。作为人脸识别系统的基础,原型图像库设计的好坏与否,对整个系统的识别性能影响很大。目前原型图像库构建大多停留在人工采集标准人脸的方法。为降低构建时所耗费的经济、人力成本,论文设计了一种原型图像库的构建技术,由基础支撑和扩展支撑两方面组成,将用户自行上传的图像作为标准人脸,省去了专门的人脸图像
学位
随着电子商务产业的迅猛发展,越来越多的消费者选择在电商平台购买产品和服务,而对于该商品的评价是消费者选择购买与否的一个重要参考。虚假评论隐藏在电商平台的海量评论数据中,对消费者有效选择商品会产生严重干扰。为进一步实现对虚假评论的有效识别,以电商平台的评论数据为切入点,构建了有标注的中文虚假评论数据集,基于一个双层图卷积网络建立了一个虚假评论识别模型,且在模型的基础上设计和实现了一个电商平台虚假评论
学位
随着计算机技术的进步,人们越来越依赖于方便快捷的网络购物,从而带动了我国物流业的发展。随着快递使用人数的增多,快递面单泄漏用户隐私信息的事件层出不穷,对快递用户的财产乃至人身安全造成危害。因此近几年来,保护快递隐私信息成为物流业研究的重点。为了解决快递面单隐私泄漏问题,在分析了现有隐私保护方案的基础上,根据系统的实际需求,设计了一种基于身份加密(Identity Based Encryption,
学位