概率XML文档中Holistic Twig查询处理算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:yaohaoyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的数据库管理只处理确定的信息,现在越来越多的数据库应用包含了非确定的信息。XML文档以其自描述性,跨平台交换性等特点,已经成为网络上数据存储和数据交换的标准。互联网上越来越多的结构化或者半结构化的数据采用了XML格式存储和交换,对XML数据的查询处理及其文档过滤的研究显得日益重要。最近,基于XML模型来描述不确定数据越来越引起了大家的兴趣。在概率XML文档的相关查询方法中,传统的查询处理方法是基于possible worlds的,其不足之处主要是,在查询的时候不得不遍历整个XML文档得到每一个possible world,然后在每个possible world上进行查询。鉴于Holistic Twig查询处理方法可以做到一遍扫描原文档即可得到查询处理的所有中间结果,本文改进了传统的Holistic Twig查询方法并将其运用到概率XML的查询中,利用概率标签流来进行查询匹配。应用于概率XML文档中的Holistic Twig算法被称为概率Holistic Twig查询处理算法。概率XML文档相对于普通XML文档,其数据的存在具有一定的概率,利用概率Holistic Twig算法在概率XML文档中进行查询处理的时候,需要对文档中的数据节点编码进行相应的改进。改进后的概率节点编码使得p-TwigStack算法成功地运用于概率XML文档的查询处理,得到了查询所需要的所有的中间结果。另外,由于概率XML文档中数据存在的概率特性,使得查询处理得到的中间结果和最终结果都具有一定的存在概率,低概率的结果无法满足查询要求,为了提高算法的查询效率,本文在算法运行的过程中加入了相应的过滤操作。过滤操作主要包括中间结果生成过程中的过滤和最终结果生成过程中的过滤。在文章的最后,对相关查询处理算法做了比较,主要包括概率Holistic Twig查询处理算法与possible worlds算法相比较的效率分析、概率Holistic Twig算法查询处理的过程中,概率过滤操作对整个算法效率的影响分析等,并且对比较结果给出相应的分析。
其他文献
IMS体系结构中非常重要的一部分就是各种形式的应用服务器,IMS系统中增值业务都是通过应用服务器来实现。Presence是多媒体通信中非常重要的一种通信方式,在这样的背景下实现
生物识别技术代表了未来身份验证技术的发展方向,而自动指纹识别技术是最可靠、最有效的生物识别技术之一。随着IC产业的发展,指纹识别系统正朝着脱离计算机,以更灵活、实用的方
随着我国金融业改革不断深入发展,银行利用较为成熟稳健的企业内部网络(Intranet),通过与各行业之间企业外联网(Extranet),面向客户提供包含基于互联网(Internet)在内的各类
Ad Hoc网络是一种没有中心节点、无需固定基础设施的多跳无线网络,网络中节点的资源(能量、内存、带宽等)受限,在不少情况下,Ad Hoc网络中的节点能量较难得到补充。另外,由于
目前,网络地理信息系统发展迅速,但彼此数据和服务共享能力差。学者们希望借助语义Web中的本体等技术来提高共享能力。然而,由于尚未创建本体的统一方法和理论,导致不同团体或个
在空间综合材料实验模块的研制过程中,地面实验系统起着重要的作用,它对空间综合材料实验模块进行测试和验证。本软件是地面测试系统的上位机软件,为空间综合材料实验模块提
指纹识别作为一个较好的生物识别方法,已得到广泛的应用。基于细节点的传统指纹识别方法很容易受噪声带来的伪细节点的影响,已没有很大的改进空间。本文以指纹纹线的宏观线形为
过程感知信息系统(Process-aware Information Systems,PAIS)中过程建模和过程实施的特征反映了PAIS过程混合了宏观抽象的问题域过程(以建模为主要目的)和微观具体的计算机域
近年来,面向服务的计算(Service Oriented Computing)和面向服务的体系结构(Service Oriented Architecture)得到了学术界和工业界的广泛关注。服务为实现开放的网络环境中各
近年来,随着信息技术的飞速发展,在众多领域的实际应用中产生了一种新的数据集合,其数据是动态的、有序的、连续的、无限的,对这种数据的处理只能按照顺序访问,并读取一次或