论文部分内容阅读
本体(Ontology)是近年来计算机及相关领域普遍关注的一个研究热点,是共享概念模型的形式化规范说明,已被广泛应用于知识工程、知识管理、系统建模、信息处理、数字图书馆、自然语言理解、语义Web等领域之中。其目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。本文首先简要地阐述了本体的相关概念,介绍了本体的研究现状,本体语言的特点、发展,本体的构建方法等。采用软件工程的思想构建领域本体,提出以领域本体作为语义理解的基础,将复杂的语义关系包含在本体中,应用领域本体显式地表示领域知识。通过中文分词、问题分类、模式匹配、本体构建等手段,应用基于本体的相似度语义计算技术,辅助消除自然语言理解的歧义,解决自然语言问询中的语义理解问题。然后根据本体理论,结合公交问答及课程问答的领域特点,使用Protege作本体编辑工具,以OWL作为本体描述语言,分别构建了公交领域本体和《计算机网络》课程本体并分析了领域本体的应用。为了准确定位站点,从问询句中抽取可能的站点关键词后,以公交领域本体作为语义理解的基础,有效融合短语的词形、词序等表层特征信息及基于本体结构的语义信息,通过编辑距离计算、基于本体的语义相似度计算等方法,应用移动问答技术,实现了基于自然语言的公交移动问答系统。以课程领域本体作为基础,应用问句类型分类、问句模式转换、自然语言处理等技术实现了课程移动问答系统,课程移动问答系统突破了答疑行为的时间和空间局限,并广泛扩展了问题解答的资源呈现形式和资源获取方式,高效率、高质量地提供学生与学科资源的交互,方便学生准确查询相关课程知识,成为传统课堂教学的有益补充。本文研究了本体的理论并应用到两个问答系统中,构建了公交及课程领域本体,借助公交领域本体,公交问答系统具有一定的容错、同义词识别、歧义消除等智能特性;课程移动问答系统,与传统问询相比,准确率更高,能更好地满足用户的问询需求。实验表明,问答系统均具有较高的准确率,本体应用达到了预期目的。