基于RNN的试题相似性检测与分类研究

来源 :湖南工业大学 | 被引量 : 1次 | 上传用户:JJ415722591
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,各级学校都在大力发展信息化教育,纷纷建立起大规模试题库系统,以便进行网络化测评。但随着时间的推移,海量题库中会收录进大量相似雷同的试题,在题库系统进行自动化组卷选取试题时需要避免相似雷同试题出现在同一份考卷中,雷同相似试题中出现重复的考点知识,对知识掌握情况进行考核与评估、自动化考试系统测评任务开展的科学性与公正性都造成影响。另外很多现存试题库系统中的试题缺乏与之相应知识点的关联分类,为系统自动化组卷出题中的考查知识点出题数量及分数分配比例造成严重阻碍,因此需要采取必要的技术针对出题试题库中的相似试题进行检测,以及针对试题所属的知识模块进行试题的自动化分类。对于上述的情况问题,本文的展开的主要研究内容如下:(1)针对海量试题来源众多,需要对试题相似度检测的任务,提出了基于TF-IDF与词向量相结合的试题相似度计算方法,通过实验表明这种结合无监督词向量相似度计算方法优于传统的TF-IDF空间向量模型计算方法。在此基准上,进而展开了基于循环神经网络的试题相似度计算模型的相关研究,利用该模型可以使得试题中存在的语义相似问题可以得到合理的度量。开展了一系列的对比实验对模型进行优化调整,验证了优化后的模型能够完成试题相似度评价任务。(2)针对试题所属知识点进行分类的问题,展开了基于预训练的词向量进行知识点分类模型的研究,提出了TF-IDF与词向量结合的计算模型对试题所属知识点进行分类,通过实验表明,该方法在处理试题分类任务上,通过计算评估可以完成试题所属知识点的分类。在此基准上,进而利用标注知识点的试题集,展开了基于循环神经网络的试题分类模型研究,通过构建循环神经网络对试题进行语义编码,对分类模型进行多组调参比对的实验从而优化模型,从处理文本多分类问题的角度完成了试题的分类任务。
其他文献
<正>近年来,我国高等职业教育得到了快速发展,已初步形成了适应我国社会主义现代化建设需要的高等职业教育体系。在“十一五”期间,高等职业教育的主要任务是加强内涵建设,提
<正>一个能用心品味到芬芳的地方,那就是人们心灵的净土。——题记如果就近寻访一方心灵净土的话,坐落在南安市西北蓬华镇境内的"香草世界"是个不错的选择。朋友对我如是说。
期刊
<正>现代大学制度肇始于德国的柏林大学。在我国,对现代大学制度建设的讨论和重视也就是近几年的事情。这些年,高教界无论是对现代大学制度的理论研究还是现实建构,尽管在路
<正> 《素问·六元正纪大论》云:“郁极乃发,遇时而作。”意思是说,天地运气失常,未到一定程度,蕴蓄于内不得发越,先呈现出迟留不发的征象,一旦碰到适当的时机,则诸状蜂起。
人才在地区城镇化进程中具有积极的正向意义。构建地区人才吸引力程度的评价体系,从地区经济水平、人才生活环境与就业环境等3个方面进行综合测度,运用熵值分析评价地区的人
为了提高啤酒行业利润,缓解啤酒生产对大米供需的影响,本课题选用玉米淀粉做啤酒辅料,但因玉米淀粉糊化困难,所以选用挤压膨化技术对玉米淀粉进行前处理。本课题主要优化了糖
阐述了卵泡发育异常的概念,并解释了其与排卵障碍的区别与联系及对妊娠的影响;构建了卵泡发育异常的诊断、分类以及中医治疗的框架;并介绍了运用调泡、移泡、增泡、灭泡、加
生态旅游是当今世界旅游业发展的大势所趋,也是我国旅游产业结构调整的重要内容。生态文明建设以及生态旅游建设已成为中国可持续发展的重要内容。而发展生态旅游首先要从生
目的 :观察依降钙素的生物学活性及破骨细胞在其影响下的形态学变化。方法 :用含不同浓度依降钙素的培养液培养Wister乳鼠的破骨细胞及离体胫骨 ,扫描及透射电镜分别观察破骨
文章基于朱丹溪原著的研读,探讨其从痰诊治结核、瘰疬、骨疽、乳痈、肠痈等后世所称中医外科疾病的学术经验与特色。朱丹溪强调指出,饮食因素与上述疾病的形成密切相关,其病