受限条件下学生作业文本相似度的研究

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:kobeantoni198774
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理技术的研究目标是采用各种技术自动化理解和解释文本信息,这些技术同样也可以用来分析学生作业。传统的NLP系统采用基于规则的推理方法,近年来随着计算机运算能力的提高和海量文本信息的出现,研究人员发现基于文本统计分析的方法更加有效,现在的文本分析方法大多是基于统计学原理的。利用统计学原理分析文本所遇到的第一个问题是如何将文本转换成计算机可处理的数字形式。基本的步骤包括抽词、过滤停用词、确定句子和段落的边界,将文本转换成可以进行统计学分析的向量。文本被转换成向量之后可以利用统计学方法比较文本之间的相似性,或对文本进行聚类或分类。但是文本分析往往比较困难,因为文本向量空间的维度(例如单词的个数)太大,因此如何降低文本向量的纬度非常重要。学生作业文本相似度研究就是要利用目前以有的比较成熟的自然语言处理技术以及文本挖掘的技术和手段对学生作业文本的相似度进行研究,主要用于了解、评价学生作业。本文首先介绍了自然语言处理和文本挖掘出现的背景和发展历史,详细阐述了中文文档分词技术、中文文档特征选择技术、文本相似度计算方法等,并以给定的学生作业为研究对象,在受限条件下对学生作业文本相似度进行了研究。最后通过实验对学生作业文本进行了相似度计算,并对计算结果进行分析和评价,发现学生作业相似度可以体现学生的思维方式、思维特点,可供教师在分析学生学习效果时参考使用。
其他文献
古诗文教学具有传承民族文化、陶冶情操、提升审美能力等重要价值,当下古诗文教学的实际效果却与《新课标》设定的教学目标有着很大的差距。本文沿着《新课标》所设定的古诗文
本文对我国企业中员工心理契约的概念、结构、内容以及意义在国内外研究的基础上进行总结和归纳,以实证研究对我国企业员工心理契约状况加以描述,尝试给出自己的心理契约定义
本文介绍了目前流行的四种宽带用户接入方式,重点叙述了电缆调制解调器(CM,Cable Modem)接入的物理层技术,包括:CM接入的组成、技术标准发展、工作机制、CM接入技术优缺点、
前不久,在红军长征三大主力胜利会师67周年之际,爆出一条消息:在北京某英文杂志当编辑的英国人重走长征路。这则消息对长征这一重大史实提出质疑:“长征二万五千里,这只是中
长期以来,以技术为导向的学科思维以及传统的教学理念严重影响着信息技术与课程教学的深度融合。翻转课堂这种新型的教学模式打破了传统的教育教学思想和组织形式,促进着教育教
收听广播是邓颖超晚年的主要“消遣”方式,然而这种“消遣”并非单纯意义上的休闲。1988年7月的一天,中央人民广播电台《新闻和报纸摘要》节目,播出了一篇《人民日报)头版发
本文采用了问卷法、访谈法和文献研究的方法,通过对所获取的数据用SPSS统计软件进行处理,分析了高中生物理学业不良的成因。一方面由于学生自身因素引起,如学生本身的非智力因素
自从中央做出建设社会主义新农村的决定以来,榆树市新民村党支部深入宣传发动,认真组织实施,加强自身建设,取得了显著成效。实施产业工程,促进生产发展。长期以来,新民村一直
1936年下半年至1937年10月,中共山东省委就设在济南市南关曹家巷11号武中奇家。在国民党特务盯梢,叛徒出卖带领抓人的白色恐怖下,武家一回又一回冒着生命危险,掩护了中共山
编辑老师您好:我是一名学新闻摄影的学生。2008年我路过南京夫子庙时,不禁止住了脚步:绿树、白墙、黑瓦……营造出一片宁静之境。而一只画舫 Hello teacher: I am a journal