小学数学应用题自动解答系统的研究——以整数一、二步和分数基本应用题为例

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:hubai123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小学数学应用题都具有结构特征和关键词语,把握每一种类型应用题的结构特征和关键词语,有助于找到已知条件与待求问题之间的数量关系。本研究旨在抓住小学数学应用题的这些特点,应用文本分类及信息抽取方法对小学数学整数和分数应用题进行分类及抽取解题信息,以实现应用题的自动解答。为了实现这个目标,本文首先对整数与分数应用题进行分类,在此基础上,给出了整数简单、二步应用题及分数基本应用题的各类题型的结构特征、关键词语串及相应的例子,并采用知网的语义表达式来描述关键词串中的关键词。其次,给出了整数简单、二步应用题及分数基本应用题各类题型的分类知识、信息抽取模式知识和解题模板知识,并用框架表示方法来表示这些知识,为其内部建立了具有层次结构的联系。再次,分析了小学数学应用题自动解答系统的解题过程,然后对解题过程所用到的文本分类和信息抽取技术的定义及常用方法做了介绍,并给出本研究所采用的文本分类及信息抽取方法。最后,给出了小学数学应用题自动解答系统的总体结构,然后对组成系统的三大模块,即查询模块、分类模块和抽取模块,分别进行详细的设计,并实现了应用题自动解答原型系统。总的来看,本文在以下几个方面作出了一定贡献: (1)给出了小学数学应用题的关键词串及其形式化定义,然后在此基础上,给出小学数学整数简单应用题、整数两步应用题和分数基本应用题,共二十种类型应用题的结构特征、关键词串及相应的例子,并采用知网的语义表达式来描述关键词串中的关键词。这些关键词串构成了应用题的分类知识,有了这些知识,系统就可以实现应用题的自动分类。 (2)给出了信息抽取模式的形式化定义,并在此基础上,手工编制出小学数学整数简单应用题、整数两步应用题和分数基本应用题共二十种类型应用题的信息抽取模式。在解题的过程中,信息抽取模式用于抽取待解答应用题的解题信息,并将这些信息填充到解题模板,它是系统成功解题的关键。此外,还给出了小学数学整数简单、两步应用题和分数基本应用题各种题型的解题模板知识,并用框架知识表示法来表示系统的分类知识、信息抽取模式知识和解题模板知识,为这些知识内部建立了具有层次结构的联系。 (3)设计出小学数学应用题的自动解答过程。该过程分四个步骤:分词、应用题分类、抽取解题信息及填充解题模板和利用解题模板中的填充信息完成应用题的解答。此外,还给出应用题自动解答过程所用到的关键技术。 (4)设计出小学数学应用题自动解答系统的总体结构,它由查询模块、分类模块、抽取模块三大模块及组成答案功能模块构成。在此基础上,对各子模块进行详细的设计,分别给出各子模块的结构图及其所具有的功能。在各子模块中,分类模块主要是用于确定待解答应用题的题型,并获取与之相应的抽取模式及解题模板,它是整个解题过程最重要的组成部分,也是设计的重点。对于分类模块的设计,主要包括:体系结构的设计和知识库的存贮结构设计。对于后者,采用树结构作为系统所用到的知识库的存贮结构。最后,实现了应用题自动解答原型系统。
其他文献
本文对芝加哥社会学派进行了研究。文章分为六个部分: 第一部分从CSS的重要性、现实意义和个人兴趣的角度简要阐述了选题原由,并简单介绍了本课题的研究状况。 第二部分
尽管迈凯伦品牌在欧美知名度很高,但是到了亚洲或者中国,迈凯伦还一时很难跟意大利的超跑品牌抗衡,所以迈凯伦采用了更务实的产品策略,推出更多低价产品来吸引客户。迈凯伦540C可以看做是570S的低配版,两车相似度很高,性能也没有太大差距,最关键的是价格能否真的有杀伤力?  当然这种级别的跑车再便宜也非工薪族能够承受,所以大多数车迷还是把目光集中到车本身吧。540C从设计上来说,更符合迈凯伦所崇尚的家族
本文通过对荣华二采区10
退役运动员个体的自身发展问题一直以来困扰着我国竞技体育事业的可持续发展和和谐社会的稳定建设,并逐渐成为体育界研究的重要领域,很多体育科学界及相关领域的专家学者和相关
体育消费是为了追求一种文明、健康、有意义的生活方式,其兴起和不断增长是社会文明进步的表现及体现。大学生尤其女大学生作为一个特殊的群体,他们与社会和学校都有着密切的联
故障现象:一辆三菱帕杰罗VIIVNDLIC型越野车,发动机型号为4G64,行程里程12.5万km。该车在行驶中滑行时,踏下制动踏板发动机就熄火。故障诊断:首先将位于仪表板下面靠近方向盘
师生关系一直是教育研究的重心之一,但以前关于师生关系的研究主要针对中小学进行,对高校师生关系的研究,研究成果还是偏少。好的高校师生关系是高校教育健康发展的基本前提和保
学位
诗词教学是语文教学中的重要组成部分,教师应充分利用生动的语言,引导学生进入想象的空间,利用多媒体手段辅助叙事诗或带动态的诗的教学,利用绘画手段加深对古诗词的理解,反
为对几十种神经元模型做出统一描述,总结归纳出目前生物医学界和工程科学界普遍认可的生物神经元的十二大基本特性,并以此为基础提出了一种更为全面反映生物神经元特性的人工
随着社会的发展和《全民健身计划纲要》的实施,很多专家学者从社区体育的角度和学校体育的角度对提高人们健康水平的影响进行了大量研究,提出了很多建设性建议,但对于如何实现社