基于扩展区间编码的小枝模式查询算法

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:venly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML数据库的蓬勃发展,XML文档存储、索引、查询的研究成为热点。由于XML数据具有分支结构多,数据冗长的特点,这给数据的存储和查询带来了极大的不便。因此,如何对XML文档进行有效的存储和查询,已经成为XML数据库研究的核心问题。  为了有效的存储和查询XML数据,研究者提出了许多针对XML文档的编码方案。这些编码方案是通过对XML文档树中的每一个结点赋予唯一编码的方式,来直接判断出结点之间的结构关系,避免对XML文档树的完整遍历。这些编码方案在一定程度上提高了XML数据的查询效率,但它们在存储空间的利用率,结点更新效率,查询速度等方面仍然存在着许多不足。本文在对现有XML文档编码方案进行深入分析比较的基础上,提出了一种支持XML数据更新的扩展区间编码方案。使用该编码方案,可以高效快速的检测出XML文档树中任意两个结点间的双亲/孩子关系,祖先/后裔关系,文档位置关系。同时,该编码减少了结点更新时,重新编码的结点数量,有效地支持XML文档更新。  在XML数据库中,小枝模式查询是XML查询处理的核心操作。Twig查询处理的效率很大程度上决定了整个XML查询的处理效率。基于本文提出的PEN编码方案,提出了一种新的小枝模式匹配算法TwigELM。通过该算法可以有效避免中间匹配结果的存取,同时能够更好的处理Twig查询分支中包含父子关系的查询。通过实验,对比了TwigELM算法与经典的Twig查询算法TwigStack,实验表明TwigELM算法在查询效率方面具有更好的性能。
其他文献
近年来,基于手势识别的人机交互以其自然、丰富和直接的交互方式受到大家的青睐。针对传统手势识别准确率不高、鲁棒性不强的问题,本文从空间序列角度出发提出了基于递归图压
无线Mesh网络(Wireless Mesh Network,简称WMN),作为一种新型的无线接入技术,由于其易部署、非视距传输、良好的健壮性、结构灵活和高带宽等优势,近年来被广泛应用于各个领域。路由
量子神经网络是基于量子计算的基本原理与传统的人工神经网络而发展起来的一种研究神经网络的新方法。由于其独特的功能在某些问题上表现出来的巨大优势,越来越多的科研人员开
统计学习方法由于可以从语料库中自动的获取语言统计知识以用于构建统计模型,且在鲁棒性、准确性上均有一定的优势,因而在自然语言处理领域中得到了广泛的应用。然而,很多自然语
随着量子计算研究的进展,后量子公钥密码逐渐成为了密码学研究的热点之一。多变量公钥密码学是后量子公钥密码学的研究分支之一。由于多变量公钥密码体制尚未有适当的可证明
随着Web2.0的应用,博客的传播速度得到了前所未有的发展,使其拥有巨大的信息资源。在数目如此庞大的博客系统中,用户想要找到自己最感兴趣的博客或博文,同时博主也想使自己的博客
伴随医疗信息化的普及,医学图像信息的重要性日渐凸显,相关影像信息为医生的疾病诊疗、学术交流、医学教学和科研等提供了极大的支持和帮助。为了达到医疗信息共享,需要对医学影
互联网的普及深刻地影响和丰富着人们的信息获取方式,数字产品作为信息的载体,以音频、视频、文本、图片、软件等形式出现并通过网络传播,满足了人们的各种需求,方便人们的生活需
可周视的全景视场三维显示技术通过光学系统再现三维物体的全景空间光场分布,从而实现对三维物体360度可周视的三维立体显示。它已经成为三维显示领域的一个重要研究方向。本
随着信息化时代的来临,互联网中各种结构化(如web页面)以及半结构化(如电子邮件,XML网页)文本数据规模呈现指数级增长并伴着信息存储技术的飞速发展而累积了海量的文本数据。海量文