基于编码的XML数据存储和查询研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yu_threestone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于XML数据具有不同于传统数据形式的特点,使得基于传统数据库的成熟技术不能有效地对其发挥作用,因此需要针对XML数据的特点研究新的处理方法。XML数据管理领域中最重要问题之一就是如何有效地存储和查询这类数据,它已经成为当前XML数据研究的热点。为了解决大量的、无固定模式的XML文档的存储以及如何提高XML路径查询算法的执行效率问题,本文分别对基于特定编码方案的XML数据的有效存储和查询结构连接算法两方面技术进行了研究。第一,针对目前大部分编码方案不能同时有效地支持文档的动态更新和存储恢复的问题,本文提出了一种新的编码方案Pri-order。该方案通过三元组表示节点的编码,有力地支持了文档的更新,在文档发生更新操作时,文档中重新编码的节点范围很小。同时节点编码的三部分相互结合,有利于保存文档结构,对存储后的原文档能够给出正确的恢复。第二,针对目前的XML数据存储方法不能有效地处理Internet上大量的,无固定模式数据的问题,Pri-order编码的基础上,本文提出了一种新的XML文档存储方法SXBP。该算法通过对文档树型结构数据进行分解,按节点类型分别将节点信息存储到定义的关系模式中,节点编码的三部分相应的映射为关系表的三个属性。同时,为了支持文档的路径查询操作,将文档中出现的简单路径也存储到一个关系表中。这种存储方法能够处理任意结构的文档,无论文档有无特定的模式,同时,对具有同一模式的文档的简单路径的存储,节省文档的存储空间。文中也研究了基于SXBP方法存储的文档恢复算法。第三,针对现有的结构连接算法在查询过程中产生的大量的,无用的中间结果的问题,本文利用Pri-order编码的性质,对现有的整体路径连接算法进行改进,关键技术是向前预读输入流中的元素缓存到列表中,对于缓存在列表中的分枝节点元素,首先判断其是否真正参与了最后的匹配结果,对于那些对最后的匹配结果无用的分枝节点元素直接从列表中删除,减小了中间结果的输出,提高查询算法的执行效率,节省查询时间。最后,在真实数据集的基础上对以上研究进行了一系列实验验证,验证本文的编码方案和基于编码的存储和查询方法,并将研究成果与之前的相关方法进行性能比较。
其他文献
油井作业施工总结审核系统是油田中校对施工总结内容的应用系统,该系统存储了大量的油田生产作业数据,完成审核的数据表明了在作业内容中曾经出现的错误。在这些不同层次的数
工作流是经营过程的计算机实现,工作流管理系统是这一实现的软件环境,而工作流引擎则是工作流管理系统的核心。目前的工作流引擎多是构建在C/S或B/S的网络结构基础上的,由于所有的
三维模型的形状分析和变形是当前计算机图形学领域的一个研究热点,在娱乐产业、人机交互、多媒体以及通讯等领域都具有广泛的应用。各种三维激光扫描仪的出现,使得三维数据的获
框架是特定应用领域中的面向对象软件重用技术,是由特定应用领域的软件体系结构所决定的软件构架。应用框架可以降低软件开发的成本、提高软件质量.随着面向对象技术、Web技
工作流技术是实现企业业务过程建模、仿真分析、优化管理的核心技术。它将业务过程逻辑从应用系统中分离出来,达到了对过程建模、重组和重用的目的。随着工作流技术的发展,用户
EFI的全称是Extensible Firmware Interface(可扩展固件接口),是在开机前(Pre-boot)环境下进行扫毒及诊断的执行环境,为启动操作系统前的程序提供了一个标准环境。从本质上讲
近年来,微电子技术、嵌入式技术和无线通信等技术的进步,推动了低功耗多功能无线传感器网络(WSN)的快速应用和发展。无线传感器网络可广泛应用于目标跟踪、入侵检测、野生动
随着计算机图形学的发展以及三维模型获取技术的提高,三维模型的数量得到了快速增长,其应用也日趋广泛,更多的人希望能够借助某种工具,在互联网上或数据库中快速准确地找到自
随着基于Internet的分布式系统的发展,XML数据已成为这些系统进行数据描述和数据交换的事实上的标准。由于高数据处理性能和可扩展性是分布式XML数据更新与发布方法的基本要
随着Internet在我国的迅速发展,远程教育和校园的信息化建设已经成为网络应用的一个新的热点。网上考试系统作为网络教育支持平台中十分重要的组成部分,是网络教育教学反馈、质