论文部分内容阅读
随着大规模在线开放课程(MOOC,Massive online open course)的飞速发展,越来越多的学习者开始接受并利用在线学习方式获取知识,在线学习平台也随之发展壮大。在各种学习平台上,海量的学习资源和交互数据伴随着学习者数量的增加不断产生。面对这些数据时,学习者如何选择合适的学习资源成为影响其参与在线课程学习效果的因素之一。由于学习者要花费大量的时间才能找到与自己学习风格和学习需求相符合的学习资源,增加了学习者的学习负担、降低了其学习效率。课程讨论文本是学习者对于课程知识内容、课程设置以及教学实施等方面的直接表述,是学习者真实学习状态和学习需求的体现。通过对课程讨论文本进行挖掘和分析为学习者推荐资源,有利于提高学习效率、快速而精确的匹配学习者学习需求、更好的实现个性化教育。本文的研究过程主要包括:第一,通过网络爬虫,获取学习者参与在线互动过程中产生的课程讨论文本数据,并对获取到的数据进行去重、降噪以及去停用词、分词等预处理,构成本文实验进行所需的语料库;第二,通过收集整理构建基于基于课程讨论的情感词典;第三,利用LDA话题模型和基于词典的情感分析方法实现针对学习者讨论文本的话题挖掘与情感分析。第四,根据获取的话题-情感分析结果为学习者推荐合适的学习资源。本文的主要研究工作以及创新之处包含:(1)构建了包括通用情感词典、网络情感词典、领域情感词典、否定词词典以及程度副词词典在内的课程讨论情感词典,弥补了在线课程领域情感词典缺乏的现状。(2)不同于对全部文本进行情感分析,本文挖掘文本中的不同话题,对每个话题进行情感分析,结果更为细致、更具有针对性。(3)面对在线学习者出现的“资源过载”现象,本文提出基于话题与情感的学习资源推荐方法,从文本层面挖掘学习者关注话题的情感倾向,为参与《Python语言程序设计》课程的学习者推荐相应的试题资源和视频资源。本文的研究结果显示:(1)本文构建的课程讨论情感词典相比于所选的通用情感词典,可以有效实现对于课程讨论文本数据的情感分析。(2)本文提出的推荐方法可以实现基于个体学习者需求的资源推荐,提高资源利用效率和学习者学习效率。综上所述,本文在已有研究的基础上,通过对在线学习平台中学习者参与课程讨论的文本数据进行话题挖掘与情感分析,获取学习者关注话题及情感倾向,根据话题与知识点之间的对应关系,计算知识点的掌握程度,进而将学习资源推荐给学习者,以期为在线学习平台的个性化教育提供新的思路与方法。