论文部分内容阅读
为了可靠而有效地管理XML数据,出现了两种类型的XML DBMS:支持XML的DBMS和原生XML DBMS。前者将树状半结构化的XML数据转换为表状结构化的关系数据,这种转换要求XML文档具有完整的模式,且在XML数据的存取过程中会产生许多问题。后者基于专门为XML数据设计的数据模型,这种数据模型保留了XML数据的树状结构,允许保存没有模式的XML文档。因此原生XML DBMS越来越受到人们的重视。原生XML DBMS可以分为两类:依赖于模式的原生XML DBMS和独立于模式的原生XML DBMS。与依赖于模式的原生XML DBMS相比,独立于模式的原生XML DBMS实现起来要困难得多,而这方面的研究才刚刚开始。本文分析了目前这种DBMS的研究现状,对这种DBMS进行了研究。
1.给出了这种DBMS的一个总体框架和数据库管理器的概念模式结构。通过这种概念模式结构,系统可以有效地支持来自多个异构数据源的外部数据。研究了DBMS的核心部件:查询处理器、存储管理器和数据库管理器,其中数据库管理器由数据管理器,索引管理器和模式管理器组成。
2.为XML数据设计了一个逻辑模型。基于这个模型,定义了树代数来处理和优化XML查询语句,讨论了如何将一个查询语句转换为一个树代数操作表达式。本文的树代数改进了现有树代数的不足。
3.讨论了查询优化的策略。为了执行树代数操作,本文基于结构连接定义了一个物理操作集,并描述了如何将树代数操作转换为物理操作。物理操作定义了基本的执行单元。对于结构连接,文中提出了基于分层编码方案的结构连接算法,这种算法优于其它算法。
4.本文提出的分层编码方案,能够满足结构连接的需要并能支持大量频繁的更新。基于这种编码方案,文中还建立了索引的逻辑结构。最后,设计了XML数据的存储模型和索引的存储模型,并给出了底层存储管理器的框架。