论文部分内容阅读
本体最初是一个哲学概念,用来描述事物的本质。在20世纪80年代,科研人员把本体引入人工智能领域,并赋予其新的含义。在计算机科学领域,本体被定义为共享概念模型的形式化规范说明。应用本体的主要目的是为了知识共享和复用。科研人员从实际出发提出多种构造本体的标准,其中最有影响的是T. R. Gruber提出的5个准则:明确性和客观性、一致性、完全性、最大单调可扩展性、最小承诺。因为本体的构造还没有一个统一的标准,所以在同一个领域内产生了大量不同的本体。这些本体间是异构的,本体映射能解决本体异构问题。 本体映射的关键是相似度的计算。对于相似度的计算,目前常用的方法有基于实例和利用启发规则两种,这两种方法都有缺点。本文把两种方法进行合并和改进,生成一种改进的相似度计算方法。本体一般理解为概念、属性和关系的集合。因为概念的属性和关系对概念有重要的描述作用,所以在本体映射中,不仅要考虑概念的相似度,而且要考虑属性和关系对概念相似度的影响。 本文从两个方面对概念的相似度进行计算。首先计算概念的语义相似度,然后计算概念的描述相似度。语义相似度是指概念之间自身语义的相似程度;描述相似度就是从属性和关系的角度说明概念的相似性,是指概念的属性或概念间关系的相似程度。在此基础上设计了一个本体映射框架MOMF(Multiple-way Ontology Mapping Framework),采用混合的体系结构。该映射框架由应用本体、参考层、共享领域词汇表、局部本体和映射模块五部分组成。应用本体中包含一个已经存在的上层(top-level)本体。本文中使用Wordnet系统。参考层提供了数据类型的匹配表和相关信息。共享领域词汇表是一个共享领域的全局术语词汇表。词汇表根据Wordnet来分类,表的每一行包含某一术语的同义词。各个局部本体的建立都以共享领域词汇表为参考。映射模块是映射框架的核心部分,它的任务是计算概念的相似度。利用两个“教师”本体对该映射框架和计算方法进行了验证和分析。最后,对所做的工作进行总结,展望了未来所要做的工作,并陈述了本体和本体映射的研究方向及发展前景。