文本挖掘技术的研究及其在教学平台中的应用

被引量 : 14次 | 上传用户:skycat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本挖掘的任务是发现文本的内容特征,研究技术涉及自然语言处理、机器学习、数据挖掘等学科,目前该技术已经广泛应用在各个领域。在网络教学平台中存放着大量的非结构化和半结构化的数据,可以将文本挖掘技术引入到教学平台中来有效管理这些零散的数据。本研究的目的就是深入学习文本挖掘技术并与实际的应用需求相结合,在教学平台中实现主观题的自动批改功能。本文首先分别对文本挖掘技术和主观题自动评分的国内外研究现状做了介绍,并认真研究了涉及到的中文分词、文本相似度计算和文本分类技术。随后,模拟教师评阅主观题的思维,引入模糊数学理论中的单向贴近度模型实现了简答题的自动评分,通过计算学生答案与标准答案的各个关键字的贴近度来衡量学生答案的正确性,简答题答案短小精悍,重点在于与关键字的匹配。但论述题的文本内容较多,就会更多地受到汉语语义复杂性以及同义词、近义词等的影响,故本文针对这类题型设计了基于文本语义相似度的计算方法,通过《知网》计算词语的语义相似度,进而构造文本相似度矩阵模型和由此形成的最大值序列逐层计算句子、段落,直至文本的语义相似度。针对KNN算法应用在主观题自动评分领域中,可能会出现的类别样本数量差异大和文本密度不均衡两种情况,本文提出了用修正权重因子来给K个最近邻打分的方法,旨在降低上述两种情况对打分的影响。最后,将上述算法做了实验验证,并在思源教学平台的作业管理模块实现了针对简答题和论述题的自动评分功能。
其他文献
<正>在北方地区,马铃薯无论做为商品薯还是种薯,冬季储藏方式都是以窖藏为主。马铃薯在储藏期间,由于储藏条件的不适宜,常会导致某些病害的加重,如:晚疫病、环腐病、干腐病、
香蕉是全球贸易量第一、产量第二的大宗水果,也是中国产量位居前五的水果之一,但它却是中国唯一存在贸易逆差的大宗水果。在国内香蕉不断增产的情况下,香蕉进口数量仍然保持
职业教育技能大赛已成为职教行业和社会的共识。作为全国职业院校技能大赛项目之一的英语口语技能大赛,势必指导和影响着高职英语教学。本文针对英语口语技能大赛的参赛情况
旅游环境承载力是旅游地理学与旅游规划学当中非常重要的一个研究内容。科学发展观使承载力的问题越来越受到人们的关注,对旅游环境承载力的研究成为旅游研究的现实焦点之一
目的:优选神曲制备过程中配料比。方法:选择麦麸与面粉用量比(麸面比)、麸面与赤小豆的用量比(碳氮比)为考察因素,将不同配料比制备的神曲在恒温恒湿箱中发酵5 d,取出,低温烘
福建省生态环境优越、自然资源丰富,是我国淮山的主要产区之一,拥有悠久的淮山栽培历史,而且淮山品质优良,目前在南平、安溪等地已形成了产业化发展趋势。本文基于长期淮山栽
从古至今,信息的传递是人们联系和交往必要手段,信息联通的高效率及低费用是人们一直的期盼。在我国,电信行业长期实行独占经营,虽历经四次拆分重组,由原来的独家垄断逐渐演
<正> 1 猪繁殖性能障碍的临床表现特征及其分类 猪繁殖性能障碍的临床表现特征为不育、不孕、流产、胎儿畸形、产仔不足、产弱仔或先天性震颤、新生仔猪早期死亡、死胎、木乃
我国农村合作金融在支持“三农”经济发展方面有着重要作用,作为我国金融体系中重要组成部分的农村合作金融主体经过几十年的发展已经发生了变化,从早期的农村信用社、农村合
<正>薰衣草(Iavandula angustifolia)为唇形花科薰衣草属多年生常绿耐寒亚灌木,别名香水植物,灵香草、香草、黄香草。原产地中海沿岸及大洋洲列岛。叶茎花全株浓香,其香味浓