论文部分内容阅读
近年来,随着数据的增长和计算能力的提高,人工智能理论与技术取得了突破性进展,在各领域得到了广泛关注。在教育领域,人工智能技术可以广泛用于优化教学活动流程、挖掘教育数据、定制个性化教学方案等方面,对教育的发展有着积极的意义。智能题库是教育智能化的一个重要组成部分,而题型分类是诸如自动组卷、个性化推荐、单元训练等智能题库任务的基础。其目标是,根据给定的问题文本和题型,学习问题文本到类别(题型)的映射关系,从而能够对输入的未知类别的问题自动判断其题型,这可以视为一个垂直领域的文本分类任务。各学科语言风格差异较大,本文选择对初等数学题型自动分类进行研究。本文首先介绍了通用领域文本分类相关理论和方法,再针对数学语言不同于通用自然语言的特殊性,研究了题型分类中的关键问题,包括数学文本预处理、特征提取与表示、融合多特征的分类模型的建立等,具体如下:1.初等数学文本的特征提取。数学文本具有普通自然语言文本的共性,而深度神经网络对于文本有着强大的表征能力,因此本文采用神经网络自动提取文本级别特征,减少特征工程,学习深层表示;另一方面,为了提取数学领域特有的数理逻辑特征,如数学变换、定理的应用等,本文利用基于自动推理的知识点标注技术,对问题的数理特征进行提取。2.研究基于词向量的特征表示。将文本特征序列和知识点特征序列转为神经网络能够处理的词向量,并在此基础上使用合适的深度神经网络结构学习问题的表示,提出一个融合多特征的深度神经网络分类模型。3.基于上述思想设计并实现了数学题型自动分类系统,解决了针对数学领域语料的预处理方法、通用自然语言处理方法在数学文本领域的改进、模型的实现、模块之间的通信等问题,实现了从文本输入到题型输出的自动化。最后,在构建的一个由64950道初中数学题组成的样本上,对模型进行训练。设计了若干对比实验,验证本文提出相关方法的有效性,实验结果表明,本文设计的多特征初等数学题自动分类系统,能够有效融合数学文本的文本特征和数理逻辑特征,提升分类准确率,较好地满足智能题库中的需求,同时具有良好的扩展性,具有一定实用价值。