论文部分内容阅读
近几年来,随着网络技术的飞速发展,XML(Extensible Markup Language)已经成为因特网上数据表示和数据交换的新标准,受到越来越多的关注。XML是一种半结构化数据,和传统数据库在数据模式上有所不同,不能直接使用传统的数据库技术进行处理。因此,随着XML查询语言与存储机制研究的日趋成熟,如何提高查询时的效率,实现查询优化成了一个亟待解决的问题。 本文首先对国内外XML查询及其优化技术的研究现状进行了综述,然后分析了现有的基于正则路径表达式的XML查询技术的特点,指出了该技术研究中存在的一些有待完善的问题。为了解决这些问题,本文以有限状态自动机为研究基础,提出了一种高效的查询重写方法,即利用物化的半结构化视图来重写用户查询的方法,以提高查询效率。最后本文设计并实现了一个XML查询处理原型系统。本文的主要工作包括: (1) 提出了视图索引技术。该技术首先对视图集中的每一个视图提取特征值,然后根据此特征值构建立一个视图索引。当对查询进行重写时,通过对此索引进行检索,可以有效地提高查找用于重写的有效视图的效率。 (2) 提出了局部查询重写技术。针对有效视图不能对查询进行完全重写,只能对某个局部实现重写的情况,本文提出了利用视图对查询局部进行替换的方法,从而能够充分地利用视图中的信息,提高查询效率,实现查询优化。 (3) 基于上述的查询优化技术,设计并实现了一种高效的XML查询处理原型系统。该系统由cache管理与查询处理两个子系统构成,对于用户给出的查询,先利用cache中的视图进行查询优化处理,然后计算查询结果。此外,还设计了两组测试方案对系统进行测试,并通过结果分析,来验证本文提出的XML查询优化技术的可行性和有效性。