论文部分内容阅读
时间是信息的重要属性。随着数据库与信息技术的迅猛发展,时态信息的应用和处理已在各行各业成为必不可少的一部分,特别是在电子政务、电子商务、数据仓库、决策支持系统等信息系统中扮演着日益重要的角色。XML作为互联网上表示结构化信息的一种标准文本格式,在信息时代发挥着重要的作用。所以将时态引入XML中,具有现实和重要的意义。随着时态XML的诞生及广泛应用,时态XML的表示、查询、更新技术也逐步引起了人们的普遍关注。时态XML索引技术作为一个较新的研究方向,在国内外部取得了一些研究成果,但是现有的索引技术都有一些缺点:关系数据模型的灵活度、无法适用于含特殊有效时间区间的XML文件、或者索引的空间复杂度高且查询效率较低。找出一种解决的办法,对时态XML的发展具有重大的意义。
本文主要讨论了针对只含有有效时间的时态XML的索引技术。首先简单介绍了一些关于XML、时态元素和时态数据库的基础知识。然后将时态信息作为元素的属性加入到XML中,在非时态XML数据模型的基础上提出了一个时态XML数据模型,该模型将一个时态XML文档建模成一个带有有效时间边标记的树结构。根据时态XML的时态信息的特点,提出时态约束,并称满足时态约束的时态XML数据模型为Well—Formed(具有良好格式的)数据模型。并在此基础上提出了基于父节点和入边有效时间的前缀编码方案以保证索引模型中原时态XML数据模型的结构不变。论文在具有良好格式的时态XML数据模型的基础上,引入节点间的基于时态偏序的拟序关系、标记名称类和起始时间类的概念,创建了一个时态XML索引模型TXIM。此模型将每一层的节点根据节点的标记名称分为若干个标记名称类,并在每一个标记名称类中根据节点有效时间区问的起始时间再划分起始时间类。并设计了基于索引模型TXIM的查询、更新算法。最后对时态XML索引查询作模拟仿真实验,实验数据随机获得。通过和遍历算法、其它索引算法实现时态XML查询作对比,验证本文提出的算法的通用性、实用性与可行性。