论文部分内容阅读
XML正迅速成为Web上数据表示和数据交换的标准。作为自描述的标记语言,XML能够根据具体应用灵活地表现异构数据源中的各种信息,包括应用程序之间的数据交换、结构化和半结构化文档以及数据库中数据的输出。本文通过对关系数据源和面向对象数据数据源完整性约束研究,提出了基于XML的异构数据源集成中间件的解决方案。该中间件为用户查询、数据共享和应用对集成信息的访问提供了底层支持。 目前基于XML的异构集成很少考虑到不同异构源数据间的语义约束,因而给出了关系模式和面向对象数据模式分别对应的XML语义约束形式,Lr和Loo。其中Lr包括主键约束和包含约束,Loo包括主键约束,ID约束,外键约束,外键集合约束和逆反约束。由于主要研究的异构源是关系源和面向对象数据源向XML的集成,并且可能出现两种数据源的数据相互约束的情况,因此还需要一个统一的约束集合这就是Lo-r,本文给出了它的定义。 本文介绍了一种集成关系数据的方法——属性集成语法(Attribute Integration Grammar,AIG)。AIG通过语义属性、语义规则和约束来扩展给定的DTD。语义属性的作用是把DTD中的元素联系起来,并且语义属性之间的关系可以控制生成XML树时节点之间的依赖关系。本文借鉴了语义属性的表达方式,并对AIG进行扩展,针对面向对象数据源,提出基于OODB的属性集成语法AIGO。本文给出的基于XML的异构集成中间件实现了这种处理异构数据的方式,并给出了实现的算法。 查询分解在属性集成语法的实现中起到了至关重要的作用,因此也是本文主要研究的方向之一。全局查询以XQuery的方式给出。为了实现对XQuery的分解,本文提出一种新的概念,即路径模式。它相当于关系表中的属性。通过参考多数据库系统中用于查询分解的模式映射树和查询树,给出了基于路径模式的模式映射树和查询树,以及查询分解的算法。