论文部分内容阅读
Native XML数据库是随着XML的广泛应用而产生的,它专门用来存储和管理XML数据。Native XML数据库具有一般数据库的特性,但它的内部存储是基于XML数据的树形结构。它所存储的XML数据都通过XML相关的技术进行访问。但它并不是一个独立的数据库,它可以建立在已有的数据库或专用的存储格式之上。Native XML数据库强调逻辑视图,它提供给应用的是树形的XML数据,而底层的存储格式对于应用是透明的。因而,在XML数据和不同底层存储之间的存储模型起到了非常关键的作用。 本文主要研究了native XML数据库的存储模型。不同的底层存储采用不同的存储模型。文中对基于关系数据库、面向对象数据库、索引文件、压缩文件的存储模型进行了详细地论述。XML数据通过这些存储模型存入native XML数据库,并且保持了XML数据的树形结构,反之,不同格式的存储数据经存储模型重构为原始的XML数据。dbXML是一种native XML数据库产品,它采用文档表存储模型,该模型将XML数据转换为符号表和压缩表进行存储,实现了一定的压缩比率并且保持了XML数据的结构。在分析文档表存储模型的基础上,提出了基于文档类型定义生成符号表和对压缩表中的数据进行自适应算术压缩的两种改进方案,在执行时间和存储空间上优化了文档表存储模型。