论文部分内容阅读
目前的数据库应用系统管理的数据大部分是与时间有关的,数据仓库就是一个很好的例子。通常把具有一种时间属性的数据称作是时态数据,时态数据的时间属性是指有效时间或事务时间,而把同时具有两种时间属性的数据称为双时态数据。与空间数据一样,双时态数据也构成了一个二维数据区域。在时态数据中,最重要的是那些与当前时间(Now或UC)相关的时态数据,但从近几十年时态数据库的发展来看,大多数的研究都集中在普通的时态数据索引技术上,而只有很少的研究着眼于与当前时间相关的时态数据的索引问题上,这也许就是为什么现有的商业RDBMS不支持时态数据索引技术的原因。虽然4R-tree索引在不需要修改现有关系数据库核心代码的情况下,就可以在现有支持R树的RDBMS上实现时态数据的查询,而且性能也和理论上最优的双时态索引GR-tree相当。但是,能为时态数据库设计出一种比现有的时态索引技术更健全且更有效的索引技术是当今时态数据库研究的重要课题。本文提出了一种新的索引技术,称为G2R-tree索引。它能有效地处理所有类型的双时态数据,而且性能与4R-tree索引和GR-tree索引相当。G2R-tree索引结合了2R-tree索引、GR-tree索引和G4R-tree索引,在2R-tree索引的基础上,对2R-tree索引技术的查询功能进行了扩充,并支持对将来情况的查询,使其既具有G4R-tree索引的优点又具有2R-tree索引的优点,同时却克服了2R-tree索引和G4R-tree索引的不足,查询时只需要同时访问2棵R-tree而不同于4R-tree索引和G4R-tree索引需要同时访问4棵R-tree,因此大大降低了I/O操作,较好地解决了查询时4R-tree索引不可避免的I/O操作剧增的问题。在索引算法和存取算法上也进行了一些改进,以便在处理所有类型的双时态数据的同时提高G2R-tree索引的性能。论文具体给出了G2R-tree索引的双时态数据变换和在2棵R-tree树上的查询变换,同时也给出了相关操作的算法和通过定理说明了变换后的G2R-tree索引在查询中的正确性,最后通过实验与2R-tree索引、GR-tree索引和4R-tree索引进行比较来验证其高效性和可行性。