论文部分内容阅读
随着语义Web的发展,本体作为一种知识表达形式,在面向语义Web的数据管理与知识工程中起着重要的作用。由于现有语义Web在信息描述上存在异构性,即针对相同的领域,不同机构组织往往采用不同的本体进行描述,导致在相同或近似领域中往往存在多个本体。本体匹配就是发现不同本体之间实体映射关系的过程。本体匹配被认为是语义Web应用中的一个核心问题。
本体匹配已经存在很多有效的方法,但现存的方法主要是利用本体概念层信息发现本体间简单的一对一的匹配,然而在现实世界中,同样存在复杂的语义映射关系。随着语义Web的发展,越来越多的RDF数据通过Web发布,Linking Open Data项目的开展推进了不同数据集的数据逐渐被互相链接起来,Web上出现大量相互关联的实例数据。为了弥补基于实例数据的本体匹配研究的不足,提出一种新的本体匹配方法,该方法基于机器学习中的归纳逻辑编程,从实例数据集合中学习概念之间隐含的逻辑匹配关系。本文提出的方法首先利用文本分类学习概念之间的相似度,然后利用不同本体中关联的实例信息之间的联系,对实例数据建模成学习器的训练样例,对学习器进行多次迭代学习,最后学习出具有一阶Horn子句形式的匹配规则。另外,对于单个本体,也可以使用类似的方法发现本体内部实体的联系,再通过概念层匹配获得语义匹配关系。在这种方法的基础上,本文设计与实现了一个本体匹配工具IOM,并通过实验验证这种方法是行之有效的。