论文部分内容阅读
可扩展标记语言(XML)作为Web上数据表示和交换的标准已经获得了巨大的成功,XML数据成了继关系型数据以后最为普遍的一种数据形式。但随着XML在数据交换,应用集成等方面的广泛应用,XML的一个重要缺点也越来越被人们所认识:XML只能表达数据的语法,而不能表达形式化的语义.这导致了两个问题:(1)XML和语义Web的差距,即XML数据及相关技术难以被语义Web所用;(2)XML与业务语义的差距,即基于XML的数据集成和应用集成困难,XML数据难以与业务规则结合。为了解决这些问题,本文分析了XML的语义问题,并提出了一种XML的模型论语义,取得了下列一些研究结果:
1.指出了XML不能表达形式化的语义,而只能以隐式方式表达语义信息。分析了XML隐式语义表达的各种方式,从而,没有通用的方式从任意的XML文档中抽取其语义,XML文档的语义必须由文档作者以某种语言显式地描述。
2.提出了XML语义定义语言XSDL(XMLSemanticsDefinitionLanguage),让XML文档作者清晰地表达XML文档中的语义信息。XSDL的语法是基于模式附件框架SAF的,它是根据XML的Schema的信息定义的,它包含了一个本体的定义以及把符合此Schema的XML文档映射到本体的规则的定义。
3.提出了从DTD和XMLSchema自动生成XSDL定义的方法。让用户可以在生成的XSDL做进一步的修改,这样可以大大节省定义XSDL的时间,特别是对符合一定范式的XML模式。
4.提出了XML的一种模型论语义。它对XML文档的解释分两步:首先是XML的简单解释,即给XML文档一个初步的解释;然后是XML的XSDL-解释,即结合XSDL定义,给XML文档一个符合作者本意的解释。这样,XML成为一种表达能力比RDF稍弱的Web知识表示语言。由此,还提出了XML文档的语义有效性和XML文档的推理问题,并把它们规约到描述逻辑语言SHOIQ(D)上的知识库不可满足性问题。
5.分析了XML的模型论语义对XML和语义Web的应用价值。它是XML和业务语义,XML和语义Web之间的桥梁。本文特别提出了XML文档之间保持语义转换的方法,还提出了基于XML模型论语义的语义数据交换的方法,这种方法相比于传统的基于XML的数据交换方法具有较大的优势。