论文部分内容阅读
随着网络和信息技术的发展,数据传输与交换成为研究的热点。XML具有开放性、简单性、高可扩展性、操作性、自描述性的优点,XML将逐渐成为数据传输与交换的一种新的标准与格式。随着时间推移,信息在不断变化,如何有效处理历史数据,当前数据,和未来数据,这就导致了时态数据库产生。以往很多学者都在研究时态关系数据库,然而时态XML方面的研究却比较少。随着XML技术的应用与发展,时态XML的研究成了一个新的研究热点,在数据模型,数据存储,数据操作(查询更新)和索引方面都有了一些成果,但是并不是很成熟。
索引是提高数据库查询性能的重要技术。传统XML索引技术比较成熟,取得了很多成果。而时态XML索引技术是一个新的研究,在国内外都取得了一些成果,但是很多都是对不同的历史版本的XML文档数据查询与维护,这些索引都有比较多的缺点:如在结构上比较复杂,导致空间复杂度较高,时态查询效率较低,维护代价也比较高,通用性不强。很多学者都在研究如何解决这些问题,这对时态XML索引技术的应用有很大的意义。
本学位论文借鉴传统XML索引技术结合时态信息的特点,研究了基于时态摘要XML索引技术。由于时态约束限制,时态信息包含了结构信息,而结构信息同样也包含相关时态信息,它们之间在某种意义上存在“相通”性。本文首先借鉴非时态XML数据模型提出了时态XML数据模型,在此基础上为时态XML数据模型设计了时态区间编码;然后深入研究了时态信息之间的数学关系:时间期间端点关系和时态线序分枝等数学关系,并设计了最小时态线序分枝划分算法;其次,在基于时态线序分枝的思想上建立了基于时态摘要XML索引,并为其设计了查询引擎和增量式更新维护算法;最后通过大量的数据仿真实验,验证了基于时态摘要XML索引技术的有效性和可行性。同时本论文的基于时态线序分枝算法思想具有一般的应用价值和推广性,如应用到时态关系索引,时态对象关系索引,面向对象时态数据索引和时空索引等情形。