XML数据的twig模式查询匹配算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:civili
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据库和网络技术的发展,XML已经成为Internet上数据表示和交换的标准。随着XML技术的不断普及,Internet上以XML技术作为载体的数据越来越多,从而对这些XML数据的有效管理和查询也越来越受到国内外研究者的关注。 目前,对于XML文档的查询,提出的算法主要是基于如下两种思想:1.路径分解思想,这种方法将产生大量的不可避免的无用的中间结果。2.新近提出的整体小枝(holistic twig)模式查询匹配方法,它把用树结构建模的查询表达式—twig模式(twig pattern)作为一个整体来处理。这种方法往往与一些特殊的编码和索引技术相结合,避免了大量不必要数据节点的扫描,使得算法的I/O代价、CPU时间复杂度和空间复杂度大大降低,从而提高了查询效率。自从Bruno N等人于2002年提出holistic twig概念以来,研究者们已经提出了一系列twig模式查询匹配算法。其中TJFast算法基于Extended Dewey编码,只要访问twig模式中的叶子节点的输入集合流就可以有效地处理XML文档查询,是一种效率较好的holistic twig模式查询匹配算法。但是Extended Dewey编码不支持XML文档的动态更新操作,且TJFast算法设计思想上的缺陷也使得算法执行效率上可以进一步提高。 本文在总结和分析了主流的XML文档编码方案的基础上改进了Extended Dewey编码,使其能有效支持XML文档的动态更新操作。提出了一种新的基于新Extended Dewey编码的twig模式查询匹配算法—TwigMatch算法,进一步提高了twig模式查询匹配算法的效率。该方法分三个步骤来处理一个twig查询模式,大大减少了查询路径匹配操作,提高了查询效率。同时本文还重组了传统的两阶段算法,恰当地选择中间结果的归并时机,获得了较好的内存利用率。 多组实验数据对比表明:本文的方法在效率上有较大的提高。
其他文献
随着多媒体、网络技术的飞速发展,图像信息的应用日益广泛,如何从大量的图像信息中快速而准确地检索出所需要的信息,已成为一个亟待解决的问题。随着大规模图像数据库的产生,
学位
钻井工程是一项多工艺环节、分地域工作的隐蔽地下工程,存在大量的复杂和不确定性因素,如何在钻前对其进行风险评估,并利用地理信息可视化技术直观地展示其评估结果,对提高钻井决
在各学科领域及实际应用中,存在着大量的分类问题。随着信息技术的迅猛发展,人们面临着急速增长的数据量,然而人们迫切地希望从已有的海量数据中获取有价值的信息或是预测未
各种以网络为媒介的信息平台在不同的领域内发挥着巨大作用,信息资源的获取和交换基本上都离不开数据库的支撑,随着网络的发展,XML显示出强大的生命力,大量的文档采用XML格式
互连网络是改善并行计算机性能的一个关键因素。Torus网络作为直接网络中典型的拓扑结构之一,具有很多优越的性质。随着处理器数目的增多,网络容错性成为一个不可回避的研究课
随着Internet技术的不断发展,各种多媒体服务对网络服务质量提出了更高的要求。为了增强网络服务质量和提供网络负载均衡,人们提出了“选播”通信模型,而保证选播通信服务的关键
随着信息技术的飞速发展,使得将计算、通信、网络与传感等功能都集成在一个设备成为可能,无线传感器网络就是这些技术紧密结合的产物。无线传感器网络是普适计算的重要研究领
图像拼接是近年来数字图像处理领域中的热点问题。通过图像拼接可以构建高分辨率或广角图像,使得单张图像具有更加丰富的信息。因此图像拼接被广泛应用于如电子地图的创建,全
作为描述系统业务逻辑最重要组成部分的业务规则,它受企业客户的多态性和市场的多变性影响总是处于频繁变化的状态,而使用传统系统建模方法构建的系统总是将易变的业务逻辑嵌入