论文部分内容阅读
随着计算机技术的不断提升,用户对信息资源的获取方式由最初的黄页目录到搜索引擎,再由传统的问答系统到个人智能助手,然而这些系统都主要是对事实类问题的查询。用户已经逐渐不满足于简单的答案检索,而是期望计算机系统理解自己的意图并能进行逻辑推理。近年来,国内外学术机构开始着力于研究类人计算推理技术,如日本启动的通过大学入学考试机器人项目。因此,考试试题的自动答题技术已成为国内外的研究热点,有助于推动自动问答系统领域的进步。本课题研究目的是构建能够自动解答高中地理因果推理类试题问题的系统。本课题的主要研究内容包括高中地理试题的分析、基于分类模型的解题方法、基于知识推理的解题方法。目前国内暂时没有成熟的面向高中考试的自动答题技术研究,本课题首先对高中地理试题进行了分类分析,结合因果推理类实际试题给出其形式化定义并分析了通用的推理方式。然后,本课题采用基于分类的解题方法,通过将原试题转换为多个是非子问题,利用文本分类模型对这些子问题进行判断。因词向量模型能够表达潜在的语义信息,本课题使用词向量表示子问题的文本特征,利用支持向量机对其进行分类并得到问题答案。最后,因地理试题依据考察知识点可以分为不同类,对于每类试题其问题描述中存在关键信息与答案对应,本课题先后通过语言模型和实体识别技术抽取问题的关键信息,利用知识推理规则库进行相似匹配计算并推理出答案。其中,后者采用序列标注模型进行实体识别处理,更能准确提取问题关键信息,获得了良好的效果。本课题的实验语料主要来自于高考地理试题、模拟试题、高中地理教材、地理类百度百科词条以及维基百科中文词条。使用基于分类模型的解题方法分别在地理高考题和模拟题上测试得到了平均0.344、0.329的正确率,使用基于知识推理的解题方法在地理工业区位因素类试题上的平均正确率为0.652,这两类方法都明显优于基于检索策略方法的平均正确率0.261。