论文部分内容阅读
随着空间数据库技术的不断发展和人们应用的增长,空间数据的时域信息的研究越来越受到关注。在这种情况下,时空数据库的诞生成为了必然。然而时空数据量的庞大和非结构化性给时空数据库系统的数据存储、访问以及分析带来许多困难,尤其在数据访问具有时间限制的应用中。而XML的跨平台性、自描述性等特点很好地适用了时空数据的管理需求,但在XML文档中同时增加时间、空间属性后,使得在时空XML文档的查询变得更加困难。为了提高时空XML文档上的查询效率,需要对时空XML建立有效的索引。当前时空XML索引的研究成果缺乏,而且很少的相关资料几乎集中在地理信息系统(GIS)领域。本文主要研究时空XML数据库索引技术。针对时态XML文档数据冗余大的缺点,首先,提出将时间信息作为元素文本值前缀的模型,与属性时戳模型和元素时戳模型相比,该模型避免了引入新的元素或属性,降低了存储空间;利用祖孙元素时间信息的关联性,对三种模型的时态XML文档进行时间冗余信息消除,进一步降低了数据冗余性。其次,为了验证XML存储方式下时空查询的有效性,构建了时空XML查询系统,并使用XPath进行了时态、空间和时空查询的实现。接着,提出一种新的时空XML索引方案——CB+-tree,该索引以时间信息作为索引关键字,且在叶子节点处添加两类链表,实现查询关键字的二次排序,同时借助实体在文档中的地址和信息长度随机存取实体信息。实验结果表明,CB+-tree索引对某些时态查询效率较高。最后,鉴于时空XML数据库数据更新在特殊情况下对索引动态性要求较高,而CB+-tree的动态更新性不佳的缺陷,进一步提出时态信息索引TCB+-tree和地址信息索引ACB+-tree双重索引方式及文档冗余存储方式。实验结果表明,结合冗余存储方法和双重索引方法,动态更新性明显提高。