论文部分内容阅读
平面几何题目的自动解答,是人工智能和智能化教育领域中长期存在的重要研究问题。该问题旨在研究智能的算法来自动理解并求解出平面几何题目,并给出解答的过程。近年来在自然语言理解和机器推理等领域的相关技术进步和智能化教育需求的合力推动下,该问题已成为热点的研究问题。解答平面几何题目是人工智能研究中智力劳动机械化一个重要问题,同时该问题的研究成果在教育上又有着巨大的应用前景。随着教育信息化和个性化智能化教育的发展,很多个性化智能教育辅导系统开始实际应用到教学服务中,而自动解答技术作为智能化教育辅导系统中的一个核心技术,将大大促进系统的个性化和智能化程度,从而提高教育服务质量和效果。由于该问题巨大的的研究和应用价值,前人已经提出了很多自动求解平面几何题目的方法,这些方法被广泛应用到几何求解系统中来进行自动推理进而给出求解的过程。这一数学机械化的研究工作大大提高了数学家发现和证明几何定理的效率。然而,这些工作大量集中在几何自动推理研究中,对几何题目自动理解的研究相对较少,而题目自动理解是自动求解题目的关键问题也是很多智能辅导系统提供教育服务的基础。一方面自然语言处理对表述多样的题目文本的处理还不成熟,尚缺乏专门针对几何学科题目文本的语言分析和理解方法;另一方面很多几何题目包含对应的几何图形,图形中包含着丰富的解题信息,为了理解题目则需要对图形进行理解,而理解图形则需要计算机视觉领域的相关技术,因此几何题目的自动理解需要计算机视觉和自然语言处理等多领域技术手段的融合。如何深入全面的自动理解平面几何题目并给出解答过程是几何自动求解中的关键问题。为了解决几何自动求解中的题目自动理解这一难点问题,本文开展了平面几何题目自动解答的理论研究,提出了基于关系抽取的题目理解和解答理论,基于这一理论,进一步提出了平面几何题目自动解答的新方法,并开发了智能交互式几何辅导系统。具体的研究内容包括:(l)完全自动化的平面几何自动解答理论:(2)纯文本描述的平面几何题目的自动解答;(3)同时包含文本和图形的平面几何题目的自动解答:(4)智能交互式几何辅导系统。本文的主要贡献有:(1)鉴于当前自动解答领域缺乏系统全面的理论框架支撑的现状,开展解答理论基础的研究,并创立平面几何题目的自动解答理论,它包括等价表示法、等价转换原理和类人解答生成方法。该理论将平面几何题目理解的问题转化为从题目中进行几何关系抽取的问题。通过将几何题目转换成几何关系组表示,进而进行自动求解,从而实现完全自动化的机器解答。(2)提出了一种句法语义混合模型的方法来提取纯文本描述的平面几何题目中的几何关系,该模型包含了语义信息和句法信息,能够高效的提取出文本中包含的几何关系。在平面几何应用题和平面几何证明题数据集上分别进行了测试,结果显示本文提出的方法在几何关系提取上具有较好的效果,应用这些几何关系来求解纯文本描述的平面几何题目也取得了较高的准确率。(3)提出了一种基于机器学习的纯文本描述平面几何题目的求解方法,该方法采用机器学习算法来自动学习出不同几何关系在题目文本表述中的潜在结构,该方法主要分为两个过程:候选几何关系生成和几何关系识别。首先对文本中的几何实体和几何关系词进行抽取,进而通过不同的组合生成候选的几何关系;然后采用机器学习算法对所有候选关系进行分类,找出所有正确的几何关系作为最终几何题目的理解结果,进而进行后续的几何推理和解答,从而实现了纯文本描述的平面几何题目的自动解答。(4)提出一种基于文本和几何图形双模态信息理解的平面几何题目解答方法来对同时包含文本和几何图形的平面几何题目进行自动理解和解答。将这两种模态中的信息单独表示成几何关系,进而采用信息融合的方法来提取出两部分高置信度的几何关系作为几何题目理解的结果,进而进行几何推理解答。在包含平面几何图形的几何题目数据集上测试,结果表明了该双模态理解方法在几何关系抽取中具有较高的鲁棒性,提高了通过单个模态进行信息提取的准确率。同时结合两个模态的信息,能够理解一些通过单个模态所不能理解的题目,进一步扩大了本文进行题目理解和解答的范围。(5)设计了一个智能交互式几何辅导系统,该系统采用学习者开始的辅导模型(leamer-initiating instruction)来接受学习者自主输入的几何题目,并能够自动理解和解答该几何题目,从而给出解答的过程和解题交互。为了与用户更自然的交互,系统采用手绘图形界面来模拟纸笔环境,同时建立文本中几何实体和图形中几何基元之间的对应关系,并将几何关系可视化的动态呈现,从而更好的让用户来进行个性化几何学习。