【摘 要】
:
XML已经逐渐成为Internet上数据的表示标准和交换工具,但其较大数据冗余造成了存储空间的大量浪费,增加了搜索处理的的时间。目前,压缩是减小XML文档大小的一种行之有效的方
论文部分内容阅读
XML已经逐渐成为Internet上数据的表示标准和交换工具,但其较大数据冗余造成了存储空间的大量浪费,增加了搜索处理的的时间。目前,压缩是减小XML文档大小的一种行之有效的方法,但是压缩后的XML文档需要解压后才能对其进行验证、搜索等操作。所以如何在压缩后的XML文档上进行搜索操作,已成为基于XML的数据交换中亟待解决问题。论文首先介绍现有的几种基于压缩XML文档的检索方法,分析每种方法的优势和劣势,比较了各个方法的性能,对其技术特点进行了讨论;其次,介绍了ITOS存储结构及其结构信息存储与值信息存储,在此基础上,提出了基于ITOS存储结构的分支搜索算法和含值搜索算法。本文提出的分支搜索算法一般无需存储搜索分支,只是得到结果的节点集合,这样减小搜索结果所占空间;提出的含值搜索算法滤去很多无用的中间结果,优化了搜索执行顺序。论文对比XPath与XQuery以及传统的分支搜索与含值搜索方法。通过理论分析,说明了本文算法具有较好的伸缩性,基于实验结果,证明了算法改善了XML文档的搜索执行效率。论文最后讨论了在Myeclipse IDE开发环境下建立的一个试验平台。该平台建立一个树形XML模型,用以生成XML,对其数据进行了仿真,给出了压缩与查询结果。
其他文献
随着信息技术的发展,尤其是数据获取技术和数据存储技术的发展,人们几乎可以随时随地获取数量巨大的数据,并存储下来。然而,数据本身的价值有限,如果没有一种有效的工具帮助
近年来,随着互联网的迅速发展,数字多媒体图像出现了飞跃式的增长,海量的图像资源给人类带来了便利同时也带来了挑战,比如,如何准确、高效地从大量图像数据库中检索出所需资
随着Internet和信息技术的不断发展,基于Internet集成和发布企业信息,为企业经营决策提供信息化平台,已成为一种发展趋势。电力系统作为国民经济的关键部门,同样面临着信息集
在数字医学图像研究中,人们经常希望根据医学断层图像恢复出真实三维物体图像,建立虚拟的人体器官和组织,以便进行医学、诊断和放射治疗计划中三维剂量场的计算。然而,由于在
随着信息技术的高速发展,计算机系统已经被广泛的应用于日常生活中的各个方面,比如电话通讯系统、银行系统等。这些系统大部分都需要后台运行的分布式算法来完成一些基本目标
在智能化的背景下,手机、电脑、电视的功能趋于多元,如何充分利用各种智能终端的优势,实现智能终端间的互通互联与资源共享,正成为未来家庭娱乐发展的目标。多屏互动技术正是
随着近年来计算机技术的迅速发展和其在生活中的普遍应用,使得网络中存储了大量的数据。集值数据的典型来源有:超市的购物记录、web查询记录、患者医疗数据等。发布收集到的数
随着多媒体技术的迅速发展,互联网上每天都有大量的图像和视频在传播和分享。图像和视频的出现使我们的生活变得丰富多彩,但同时也带来了一系列的问题。例如,人们越来越喜欢
随着Internet的不断发展,作为半结构化语言的XML逐渐成为重要的数据载体,诸多应用和服务都采用XML作为数据传输对象,因此XML数据的安全性变得非常重要。在这种情况下,针对XML
随着信息管理技术的发展,现代社会已步入信息社会,信息量与日俱增。而与此相矛盾的是,在某一方面,信息量又显得非常匮乏,所掌握的信息也同时存在不完确定性和不完全性。为了