论文部分内容阅读
近年来,信息技术的快速发展给人们生活带来了极大便利的同时,也逐步影响着当前的教育模式,不断推进着教育信息化进程。随着教育信息化进程的不断深入,国内外涌现了各式各样的教育系统,不仅打破了传统课堂教学在时间与空间上的约束限制,还为学习者提供全面的前沿知识课程,降低他们的学习成本。与此同时,这些教育系统收集并积累了海量的、复杂的试题数据,这些试题数据对于巩固学生知识,辅助教师教学、改善教学管理等方面发挥着巨大作用。如何有效地对试题进行建模分析,理解与表示试题蕴含的语义信息,并与相关试题应用相融合,成为教育数据挖掘领域重要的研究课题之一。教育数据挖掘领域研究学者已经开展了诸多针对试题建模方法与应用的研究工作。然而,现有的试题建模方法和应用仍有待研究和可改进的空间。首先,针对试题建模方法,包括数学、物理等许多学科的试题含有文本、图片和知识点等多异构数据,而现有的试题建模方法只专注于试题文本,忽略了蕴含于异构数据中的试题语义信息,从而降低了对试题建模的有效性。其次,针对试题建模结果的应用方面,如何将对含有异构数据的试题的建模结果和相关试题应用进行有效融合仍是一个开放性问题。因此,针对以上研究问题,本文结合能够有效地处理异构数据的多模态学习方法,对试题建模方法及应用进行了研究,首先,针对含有异构数据的试题,提出了一个基于多模态学习的试题表征模型MERM对试题进行建模表征;其次,将具有异构数据的试题的建模结果,合理地融合到相似试题发现任务应用之中,提出了一个基于注意力机制的多模态神经网络框架MANN。总的来看,本文的主要研究内容和贡献有:1.提出了一个基于多模态学习的试题表征模型MERM。该模型利用多模态学习方法从试题的异构数据(包括试题文本、图片和知识点)中学习试题的统一语义表示,其中设计了文本-知识点注意力机制和文本-图片注意力机制分别学习试题中文本-知识点、文本-图片之间的关联。2.提出了一个基于注意力机制的多模态神经网络框架MANN。该框架利用基于多模态学习的试题表征模型MERM学习得到的试题的统—语义表示,结合相似性注意力机制刻画试题之间相似的部分,进而计算两道试题之间的相似性,有效地解决相似试题发现任务。3.本文在真实数据集上进行了大量的实验。实验结果证明了本文所提出的MERM模型和MANN框架的有效性以及MANN框架具有很强的可解释性。