论文部分内容阅读
XML已经成为事实上的互联网数据存储、交换、表示的标准。随着XML应用的普及,对XML文档存储和查询的要求也越来越高。传统的关系型数据库由于关系模型本身的局限性,不能很好的表示XML数据,同时SQL,OOL等传统的查询语言也不能很好的利用XML文档的结构信息。因此,在不久的将来,Native XML数据库以其自然处理XML的方式必然会成为热点。
本文以研究Native XML数据库中索引查询技术为主,同时也研究了Native XML数据库的相关技术,例如存储。文中对Native XML数据库中各种索引结构进行了详细的研究,并且提出了一种新的XML文档集成索引结构。最后实现了一个Native XML数据库原型系统一XSQS(XML Storage and Query System)。
本文主要工作如下:
1.XML文档编码方式。在研究了各种流行编码编码模式之后,根据集成索引的需要,在区间编码的基础上进行修改,提出了XSQS系统编码方式。在XSQS中,我们也采用该模式为简化的DTD树模型进行编码。
2.XSQS集成索引。为了提高XML数据的查询效率,人们致力于研究XML索引结构。本文提出一种利用了DTD信息的集成索引,将各种类型索引集成在一起,这样大大降低了整个系统中索引建立和维护的代价。尤其对于复杂的混合型查询,该集成索引比单一索引效率高。同时由于充分利用了DTD信息,当查询路径在XML文档中不存在时,能够快速返回无结果信息,无须再进行下一步的查询处理。
3.原型系统XSQS(XML Storage and Query System)。为了更好的研究NativeXML数据库系统,同时也为了验证本文提出的集成索引及相应的查询处理技术,本文在上述研究成果的基础上实现了一个Native XML数据库原型系统-XSQS。该系统可以存储和处理XML文档,并且对于复杂的查询有较好的效率。