中文MOOC论坛课程中情绪分析及知识难点的挖掘研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:maailin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模开放在线课堂(massive open online courses, MOOC)为人们提供了免费学习世界顶尖高校优秀课程的机会。随着MOOC的风靡,其产生了海量多样化数据,这一领域逐渐引起了越来越多的研究者的兴趣,但大部分集中在对学生建模,预测其学习效果或者是否会完成课程方面,而对MOOC讨论区还未有太多研究,尤其是对中文MOOC平台的讨论区。MOOC中学生身份多样,学习背景不同,还存在完成率较低的问题,所以MOOC中的授课方案需要适当修改,一般情况下是以学生的作业和考试情况为依据来修改。讨论区是学生和老师交流的重要工具,掌握讨论区情绪也是评估学生学习质量的重要组成部分。本课题的目的是从分析讨论区情绪的角度出发,使用数据挖掘的方法,筛选出特定类别的讨论帖,减少了老师浏览和解答帖子的时间,并且提取出知识难点,帮助他们更加合理地安排课程知识点结构和改进教学方法,提高授课效果。本文使用机器学习和自然语言处理的理论和方法,构建了一个MOOC论坛讨论帖的数据挖掘系统。本文把MOOC讨论区的讨论帖分为三个类别:“困惑”、“解释”和“无关”,通过训练SVM模型来预测讨论帖的类别,从而完成课程的情绪分析。对于预测为“困惑”和“解释”的讨论帖,应用TF-IDF和TextRank算法提取关键词,作为知识难点的初步结果。本文先介绍了构建该数据挖掘系统用到的理论知识,为接下来的系统实现打下理论基础。这一部分主要介绍了机器学习中的分类算法和自然语言处理中的关键词提取算法。第三章描述了数据挖掘系统的设计和实现。第四章应用此系统处理了六门课程,讨论和分析了得到的结果。最后一章总结了本课题的主要成果以及不足之处,并对下一步工作进行了展望。
其他文献
为有效降解烟叶中的纤维素,改善烟叶的整体品质,从不同产地原烟表面初步分离出具有降解纤维素能力的菌株;通过测定菌株所产纤维素酶活性,筛选高产纤维素酶菌株并进行16 S rDN
新疆吐鲁番盆地气候炎热、干燥、多风,光热资源十分丰富,年平均日照时数2900~3100h(小时),太阳总辐射581.7 ̄644.5kJ/cm2,≥10℃积温4525.5~5548.9℃,无霜期长达200~230d(天),是新
本文从教育与政治关系的角度来对汉代太学进行分析,认为作为当时最高官办学府的太学有三大政治作用:(一)从产生的政治目的上来看,太学是为了招纳贤才、独尊儒术;(二)从客观影响上来看
幽门螺杆菌(Hp)感染容易引发胃溃疡、胃腺癌及慢性胃炎等疾病,根除Hp是临床进行疾病治疗和预防的重要措施。但是由于抗菌药物的滥用,让Hp的防治工作难度加大,本文首先对Hp致
前列腺癌是男性常见的恶性肿瘤,其发病率和致死率呈逐年上升趋势。目前临床上针对前列腺癌治疗手段主要为手术根治,化疗放疗和包括去势、抗雄激素、雄激素受体介导的雄激素阻
铁路施工企业的迅速发展,铁路项目施工管理变得越来越重要,其中,以规范的党建工作在铁路项目施工中得到了广泛地应用和推广。加强以规范的党建工作建设,对于铁路项目施工管理
锂离子电池的动态性能受温度、电流及老化等多种因素制约,限制了电池储能系统的大规模推广和应用,同时由于传统的参数辨识方法只能准确辨识电池开路电压,而复杂的储能电池工况却
传统的医用财务管理信息系统存在着效率较低、成本过高、信息评估对象单一、指标权值主观化和定量研究不足等弊端。文中针对医院财务管理体系当前的缺陷,采用Power Builder数
结合洛阳理工学院无机非金属材料工程专业的现状和工程教育的特点,确定卓越工程师培养的专业方向,构建"校企共建、联合培养"新机制,打造实践教学平台,从人才培养方式和途径等
<正>今年是"十三五"开局之年,是自治州全面建成小康社会的决胜阶段,面对维护稳定、经济下行、保障民生等多重压力,州直各级党组织和党员干部,团结带领各族干部群众,讲政治、