论文部分内容阅读
近年来,随着WWW(World Wide Web)的迅猛发展,半结构数据的管理已成为数据库领域中的一个十分重要的研究方向。特别是XML(eXtensible Markup Language)作为一种新的数据交换事实上的标准,使得WWW上的数据交换和集成成为可能。将Web上的半结构数据迁移到XML上是对WWW上巨大数据进行有效管理的一项十分有意义的工作。因而,基于XML的半结构数据管理的研究目前已成为国际数据库界的一个重要研究方向之一。 半结构数据索引的研究是半结构数据管理的研究的一部分。半结构数据索引既有与传统数据库相同的部分,也有不同于传统数据库的部分。传统数据库的一部分成熟技术可以比较方便地移植到半结构数据上来。但是,由于半结构数据的特点,半结构数据索也引带来一些新的研究问题。 由于XML的数据表达能力强大,XML完全可以在互联网和数据库之间扮演十分重要的角色。本文对半结构数据索引的研究都基于XML的图模型。目前对半结构数据索引的研究已较为深入,已经有一些较成熟的基于XML的半结构数据索引。针对半结构数据索引的特点,我们主要从数据表示、索引接口、路径模版的形式、索引的导航方式、节点的定义、索引的更新和索引的存储七个方面对这些半结构数据索引进行分析和分类。我们对已有的半结构数据索引都进行了较为详尽的介绍和其特点的分析。特别地,对BUS索引给出详尽的介绍并分析该索引存在的不易文档动态更新的缺点。于是,我们建立了一个支持文档动态更新的半结构数据索引原型系统。我们建立的原型系统,采用与关系数据库结合的模式,具有适应文档频繁更新的优点,使文档节点的插入和删除实现较为容易。最后,我们通过实验数据的分析和比较,验证了在文档內容和结构频繁更新情况下该原型系统半结构数据索引的执行效率。