论文部分内容阅读
在线学习社区中的学习分析研究对于了解学习者的学习情况,辅助教师进行教学决策有着重要的意义。该领域研究早期主要基于统计和行为数据进行学习行为分析,近年来研究者越来越关注到短文本等非结构化数据对学习过程的影响。随着在线学习社区中短文本数据的不断积累,如何有效地利用这些短文本数据中的隐含信息,已成为增强学习分析效果的关键问题。基于短文本的学习分析研究受到文本本身的质量、语义理解的准确性和行为分析的方法等多个因素的影响,还值得进一步研究。因此,本文利用深度学习和自然语言处理技术,提出了短文本增强在线学习社区学习分析研究方法。在此方法中,本文基于大型预训练语言模型设计了基于层次化修正框架的文本纠错模型,以提高学习社区中文本数据的质量;同时,本文提出了短文本增强的学习行为分析框架。在此框架中,首先利用改进的文本特征提取器以提取文本隐含信息;其次,通过深度学习融合多种信息构建了端到端的学习行为分析模型,进行短文本增强的学习分析。基于此,本文的主要工作如下:1)为了修复原始文本中的错误,得到更高质量的文本数据,本文结合大型预训练模型设计了基于层次化修正框架的文本纠错模型。首先,该模型基于BERT对源文本进行建模,得到文本的多种语义表示;然后,使用语义表示计算错误出现的概率,从而定位文本中存在错误的位置;最后,使用层次化修正框架得到每个错误位置具体的修正操作。基于CONLL-14公开数据集进行了实验,结果表明本文模型比基线模型有更快的解码速度和更高的召回率。2)为了将文本数据应用到学习分析的研究中,本文提出了短文本增强的学习行为分析框架。此框架分为三个步骤:首先,确定需要利用的文本特征类型;其次,针对学习社区的特点,基于自然语言处理技术构建文本特征提取器,提取相应的文本特征;最后,将文本特征与其他特征相结合,构建端到端的行为分析模型并开展学习分析研究。在此框架下,通过一个情感增强的成绩预测实例对其有效件讲行验证,结果表明本文的框架能够有效提升行为分析的准确性。