论文部分内容阅读
语义Web是新一代万维网标准,作为语义Web核心的本体,可以表示资源本身以及资源之间丰富的语义信息,因此要发展语义Web,就要构建语义丰富的本体。XML不仅能表示结构化数据,还能表示半结构化数据,而目前标准的语义Web本体语言是OWL,因此,如何利用这些大量存在于Web中的XML数据源,通过本体学习的方法来开发OWL本体,已经成为一个重要课题。目前,该领域的研究焦点主要集中在两个方向:一个方向是创建XML文档到一个已存在OWL本体的映射;另一个方向是提取XML文档结构中隐含的语义信息,创建新的OWL本体。本文在第二种映射策略的基础上,从XML文档结构中提取更多的隐含语义信息,描述了XML/Schema到OWL本体的全面映射规则。本文首先对XML/Schema与OWL DL中的元素进行了简要的介绍,给出了XML/Schema与OWL DL的形式化定义,然后对XML/Schema与OWL DL的特性进行了详细的分析和比较,对XML/Schema与OWL DL之间的相似概念和机制进行归纳,总结了完善的对应关系。由于本体由本体模型和本体实例构成,因此本文将XML/Schema到OWL DL本体的映射分为两个子过程:首先将描述XML文档结构和元素类型的XMLSchema映射为OWL DL本体模型,即创建OWL DL本体中类的层次结构、对象属性、数据类型属性、属性的约束和特征等信息;然后将符合该XML Schema模式规范的XML文档映射为OWL DL本体实例,即创建OWL DL本体中的个体和个体之间的属性等信息。创建的OWL DL本体模型和OWL DL本体实例就构成了映射成的OWL DL本体。在每个映射子过程中,首先给出形式化的映射规则,实现抽象层次的映射,在此基础之上,从XML/Schema的抽象数据模型出发,描述各个组件到OWL DL本体的具体映射规则。最后,基于XSLT技术开发了一个映射工具用于完成从XML/Schema到OWL DL本体的映射,来验证本文所提出的映射方法的可行性。