论文部分内容阅读
小学数学应用题都具有结构特征和关键词语,把握每一种类型应用题的结构特征和关键词语,有助于找到已知条件与待求问题之间的数量关系。本研究旨在抓住小学数学应用题的这些特点,应用文本分类及信息抽取方法对小学数学整数和分数应用题进行分类及抽取解题信息,以实现应用题的自动解答。为了实现这个目标,本文首先对整数与分数应用题进行分类,在此基础上,给出了整数简单、二步应用题及分数基本应用题的各类题型的结构特征、关键词语串及相应的例子,并采用知网的语义表达式来描述关键词串中的关键词。其次,给出了整数简单、二步应用题及分数基本应用题各类题型的分类知识、信息抽取模式知识和解题模板知识,并用框架表示方法来表示这些知识,为其内部建立了具有层次结构的联系。再次,分析了小学数学应用题自动解答系统的解题过程,然后对解题过程所用到的文本分类和信息抽取技术的定义及常用方法做了介绍,并给出本研究所采用的文本分类及信息抽取方法。最后,给出了小学数学应用题自动解答系统的总体结构,然后对组成系统的三大模块,即查询模块、分类模块和抽取模块,分别进行详细的设计,并实现了应用题自动解答原型系统。总的来看,本文在以下几个方面作出了一定贡献:
(1)给出了小学数学应用题的关键词串及其形式化定义,然后在此基础上,给出小学数学整数简单应用题、整数两步应用题和分数基本应用题,共二十种类型应用题的结构特征、关键词串及相应的例子,并采用知网的语义表达式来描述关键词串中的关键词。这些关键词串构成了应用题的分类知识,有了这些知识,系统就可以实现应用题的自动分类。
(2)给出了信息抽取模式的形式化定义,并在此基础上,手工编制出小学数学整数简单应用题、整数两步应用题和分数基本应用题共二十种类型应用题的信息抽取模式。在解题的过程中,信息抽取模式用于抽取待解答应用题的解题信息,并将这些信息填充到解题模板,它是系统成功解题的关键。此外,还给出了小学数学整数简单、两步应用题和分数基本应用题各种题型的解题模板知识,并用框架知识表示法来表示系统的分类知识、信息抽取模式知识和解题模板知识,为这些知识内部建立了具有层次结构的联系。
(3)设计出小学数学应用题的自动解答过程。该过程分四个步骤:分词、应用题分类、抽取解题信息及填充解题模板和利用解题模板中的填充信息完成应用题的解答。此外,还给出应用题自动解答过程所用到的关键技术。
(4)设计出小学数学应用题自动解答系统的总体结构,它由查询模块、分类模块、抽取模块三大模块及组成答案功能模块构成。在此基础上,对各子模块进行详细的设计,分别给出各子模块的结构图及其所具有的功能。在各子模块中,分类模块主要是用于确定待解答应用题的题型,并获取与之相应的抽取模式及解题模板,它是整个解题过程最重要的组成部分,也是设计的重点。对于分类模块的设计,主要包括:体系结构的设计和知识库的存贮结构设计。对于后者,采用树结构作为系统所用到的知识库的存贮结构。最后,实现了应用题自动解答原型系统。