基于索引的XQuery实现的优化

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zj75924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML日益普遍的应用,如何快速准确地访问XML文档中的数据已成为急需解决的关键问题,这涉及到对XML查询语言XQuery实现的优化研究。目前可以通过多种途径对XQuery进行优化,如:执行策略、物理优化、代数优化等。执行策略主要是根据路径条件选择遍历节点的方式,如自底向上或自顶向下的遍历策略,以减小遍历节点的代价。物理优化主要是采用高速缓存来缓冲CPU运算与内存访问之间的差距,从而达到整体速度的提高。代数优化主要是基于XML的数据模型和传统的逻辑操作对路径表达式进行优化,从而达到优化XQuery的目的。 当前已存在多种基于索引的XQuery实现优化的方法,如Lore系统中的Dataguide、XISS、DBXI等。Dataguide对XQuery中经常出现的“∥”操作没有提供特殊的支持,并且只记录了从文档根节点出发的路径,从而丧失了许多优化的可能性。在XISS系统中,对于复杂的路径表达式在XML数据树中要搜索很多空间,处理每个XML文档所需的结构连接运算的次数至少有N—1次,加大了查询的复杂度,从而影响查询效率。DBXI是一种基于DTD的XML索引方法,当DTD中存在环路时搜索空间会很大。 本文首先分析这些优化方法,指出他们的优缺点,并在此基础上引入一种基于R树的索引机制,解决了快速判断XML文档中节点间祖先、子孙关系的问题。将XML文档以R树的形式进行存储,对树中的节点建立索引。在查询时将节点关系的判断转化为节点域的包含关系的判断,同时利用R树范围查询快速、高效的特征提高查询效率。另外还引入了索引关键字的分割表和最小分割表跳过与查询不相关的节点,减少了磁盘I/O次数,进一步提高查询效率。 在本文的最后,我们还给出使用基于R树索引对XQuery的实现进行优化的实例,并针对存在的一些问题,提出今后进一步的工作。
其他文献
遥感技术的发展使得遥感数据量急剧膨胀,这给存储和传输带来不便,采取有效的编码,压缩数据量是解决这些问题的关键。 分形和小波编码技术是新一代编码技术,是目前静态图像编码
文本聚类是在没有文本类别标记的情况下对文本进行分类,使同类别的文本间相似度尽可能大,不同类别的文本间相似度尽可能小。而今,随着信息的爆炸式增长以及学科类别间的交叉渗透
在过去的几年里,以Gnutella和KaZaA为代表的文件共享网络已经成为Internet上增长最迅速的应用。这种运行于多个对等结点之上的逻辑网络被称为对等网络(P2P网络)。在这样的网络
不确定性普遍存在于主观和客观世界中,模糊性是它最重要的形式之一。不确定性人工智能是人工智能的深化和发展,现已经成为人工智能研究的热点和重大的前沿课题。而模糊逻辑系
近年来,随着网络技术和Internet的迅速发展,基于Browser/Server结构的Web应用,因其具有易用性、通用性、良好的可扩展性等优点而发展迅速,正逐渐成为实现企业应用信息系统的主流技
随着互联网的不断发展,网络已经是我们生活不可分割的一部分。从而使得为了网络而生的技术——Java大行其道。而Java在嵌入式领域的版本——J2ME(Java2MicroEdition)也由于芯
随着信息技术的快速发展和业务需求的变化,数字医院提高自身业务水平的要求越来越迫切,以医院信息系统与应用为代表的医院信息化建设,已成为医院改善医疗环境、提高管理水平和医
子空间方法是一种根据应用需要对高维数据进行降维处理的方法。它寻找一种线性变换将高维的数据投影到低维的子空间中去以达到降维的目的。这种方法在对高维数据进行处理时表
在已知边带权的连通图中找一棵边权总和最小的生成树的问题很早就被提出和研究[15,14】,并且也得到了广泛的应用【15,14,23】。但是在日常生活中也会遇到这样一类类似的问题,抽象
6PE技术是实现IPV4向IPV6过渡的一种技术,目的是连接IPV6孤岛。它实现了纯IPV6信息跨越IPV4 MPLS骨干网。V6 CE传送IPV6数据至PE,PE支持双栈,可同时处理V4N6业务。然后,6PE路由器