论文部分内容阅读
大数据时代和多样化数据对Web技术和传统数据库技术提出新的挑战,XML数据作为Internet上数据描述和数据交换的标准之一其灵活的存储结构和高效的查询反应很好的适应了Web数据和多领域专业的数据存储及处理需求。目前对时态XML的研究主包括时态XML索引和时态编码的研究,以及基于版本管理(version manage)的时态XML文档处理技术。前者的研究主要集中在如何提高语义查询和结构查询的效率,对时态XML文档的快照查询专门研究的较少。后者的研究主要集中于如何有效管理时态XML文档的存储空间,对时态查询效率较少关注。 本文研究基于时态拟序关系和快照查询的时态XML索引技术。首先,参考Xpath查询数据模型的结构并结合时态XML数据本身的特性,将时态XML文档建模为有根分层图。其次,参考XML索引的编码思想设计了时态XML深度优先遍历编码TXDFC。然后,以时态节点为处理逻辑单位,提取时态节点的有效时间区间,并引入“时态拟序”关系构建“线序划分”,设计“下优先遍历算法”。结合快照查询只有时态约束没有语义约束和结构约束的特点,对时态XML文档的有根分层图设计分层索引结构TXDFCIndex。之后,给出了基于索引结构的查询算法和增量式更新算法。最后,通过与相关工作进行仿真比较,实验结果数据表明本文工作的可行性、有效性和优越性。