论文部分内容阅读
本体是一种重要的知识表示形式,它是共享概念模型的明确的形式化规范说明,并在语义Web、知识工程、软件工程、生物医学信息学和社会化网络等领域中得到广泛应用。然而,本体创建的主观性、分布性和自治性特点导致大量异构本体的产生,阻碍系统间的语义交互。本体异构成为基于本体的很多应用面临的挑战之一,本体映射则是解决本体异构的主要手段。
本文提出一种新的基于Web知识的本体语义映射方法。现有关注语义映射的本体映射方法大多需要依靠外部知识库,如WorNet和语料库。考虑到Web知识库具有信息量大、不断更新等特点,本文尝试将Web信息作为背景知识库来辅助发现语义映射。首先利用搜索引擎获取Web知识,再用基于本体语义的修正规则对查询Web知识库获得的候选映射集进行处理,最后从无矛盾的候选映射集中提取出语义映射。该方法是对现有基于传统知识库的本体语义映射方法的一种补充。
本文的工作包括以下几个方面:(1)解决如何从Web获取可用于本体映射的知识的问题。将本体元素之间的语义关系转化成特定的句法模式,利用搜索引擎从Web获取本体元素的句法模式。(2)解决如何根据搜索引擎查询结果判断本体元素间是否存在语义关系的问题。将搜索引擎查询的命中数和Goolge距离相结合,定义出反映元素间语义关系置信度的权值,根据权值判断语义关系是否成立。(3)解决从Web获得的知识与本体语义不一致的问题。提出基于本体语义的修正规则,应用规则能够消除利用Web知识构建的候选映射集中的矛盾并修正映射权值,得到更加准确、完整的本体映射。(4)设计出本文所提出的本体语义映射方法的算法,在Eclipse平台下用Java语言实现该算法并进行实验。实验结果表明,该基于Web知识的本体语义映射方法能有效发现异构本体的概念间语义映射,与同类本体映射方法相比映射效果有所提高。