基于文本挖掘的试题知识点和认知动词标注方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:xmzhkj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线教育平台为学习者提供学习资源的同时,也存在信息过载和信息孤岛的问题,采取何种方式组织这些教育数据已成为教育数据挖掘领域关注的焦点。试题是一类重要的教育数据资源。在教育活动中,通常采用答题数据来检验教师教学质量和学生学习情况,教育目标评价与试题的设计和组织密切相关。根据修订版布鲁姆教育目标分类学,教育目标由知识点和认知动词两个维度量化评价,知识点和认知动词分别描述了预期学习者所要学习的内容及其对所学内容的掌握程度,因而可从知识点和认知动词层面来组织试题等教育数据资源。试题数据多以非结构化文本的形式存在,且试题标注本质上是一类文本分类任务,因此可从文本挖掘的角度来研究试题知识点和认知动词标注问题。本文利用文本挖掘技术对教育文本进行预处理和文本表示,继而探索知识点间的关联、认知动词间的分布差异,实现分类标注。具体研究内容如下:(1)在试题知识点标注方面,本文提出了一种基于重要度加权的关联分类试题知识点标注方法。首先,从教材中构建全连接的知识点网络,并采用PageRank算法计算知识点重要度。其次,按知识点标签划分试题和教材章节内容,采用Apriori算法从知识点试题子集中抽取出频繁项集,通过TF-IDF抽取教材特征词。最后,合并知识点频繁项集和教材特征词,构成知识点规则,并定义知识点重要度加权下的知识点规则和试题间语义相似度计算方法,实现知识点标注。(2)在试题认知动词标注方面,本文提出了一种基于概率分布估计的半监督集成试题认知动词标注方法。首先,选用多特征组合的方式表示试题文本,并构建深度学习模型来估算试题认知动词概率分布,用以扩充试题表示。之后,用含认知动词概率分布的试题表示来训练集成学习模型。最后,结合无标签试题数据,对深度学习模型和集成模型进行联合训练,即采用标签传播算法和集成学习模型对无标签试题进行联合标注,将标注一致的试题及伪标签添加到训练集中重新训练深度学习模型和集成学习模型。实验结果表明,本文提出的方法能有效实现试题知识点和认知动词标注,且在建模中考虑知识点关联关系和认知动词分布差异可以进一步提高标注效果。此外,本文从文本可视化的角度对知识点间组织关系、认知动词界限进行解释,使研究结果更具说服力。
其他文献
歧义容忍度这个概念最早出现在心理学研究领域,是由美国心理学家Frenkel Brunswick于20世纪30年代首次提出,并在20世纪80年代由一些语言大家引入到语言学领域。以Oxford为代
航行在海面上的船舶在遭受到海浪、海风、海流等海洋环境的影响后,不可避免地会产生不希望的多自由度的摇荡运动。在这些不希望的多自由度摇荡运动中,由于船舶的横摇运动阻尼
由于双馈风力发电机组对于电网电压的变化比较敏感,在没有采取相应措施的前提下,将会导致在电网电压故障下双馈发电机组的大面积脱网,甚至进一步造成电网崩溃。为了提高双馈
股票市场投机泡沫是指价格偏离了其内在价格。历史的经验教训告诉我们投机泡沫如果任其发展,会给金融市场带来巨大的冲击和破坏。因此对投机泡沫的研究,弄清楚泡沫的成因,找
本文首先系统概述了锂离子电池及其负极材料的研究进展。自从锂离子电池商品化以来,已经广泛应用于电子产品中,为了满足纯电动汽车和混合电动汽车的发展,必须寻找新的负极材
目的:通过分析22例喉结核患者的临床表现、喉镜特征以及实验室检查结果等临床资料,总结得出喉结核的临床特点及诊断要点,以期为喉结核的早期鉴别及诊断提供理论依据。方法:本研究于2015年1月~2018年12月选取了我院收治的22例喉结核患者作为研究对象,通过对患者临床资料的回顾性分析,总结了患者的临床特征、诊断方法及诊断效果。结果:1.临床特征:喉结核患者的临床症状主要为声音嘶哑,占比81.82%,其
复用包含波分复用、偏振复用、轨道角动量(OAM)复用等技术,它广泛应用于光通信领域包括量子保密通信,是目前信息科学的研究热点。所谓偏振复用,即随机选择任一 Stokes参量作
随着现代化、城市化的推进,我国的能源需求大幅提升,其中资源限制与电力需求、电网发展与经济发展将面临巨大挑战。区域电网饱和电力需求是电网规划中确定电网健康发展最终规
中俄关系日益密切,文化交流进一步深入,经济合作日趋频繁,在此背景下国内对俄罗斯的研究愈加深入。梁赞州属于俄罗斯中央管区,毗邻莫斯科州。梁赞州地理位置优越,自然资源丰
板式换热器是广泛应用在石油化工、核电和船舶等领域的重要能源设备。随着工业技术和应用领域的不断发展,板式换热器逐渐向高温、高压的极端工况和大型板片的方向发展,板片的承载能力要求也越来越高。但板式换热器相关标准中尚未明确对板片结构强度的设计要求,为全面提升板式换热器的综合性能,本文采用实验和数值模拟计算方法,开展波纹板片结构承载特性与换热性能研究。本文通过波纹板片材料与结构的拉伸实验和波纹板片承载特性