基于索引技术的XML查询优化研究

被引量 : 0次 | 上传用户:zh0518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今XML数据被广泛应用于不同领域,其数据和文档规模不断增大,数目不断增多,导致网络中出现了大量的具有复杂结构的XML数据。如何高效管理和查询结构复杂的XML数据是当前人们面对的一个普遍且关键的课题。在过去的十多年中,众多的研究人员和学者从不同的角度提出了各种查询优化的方法,其中利用编码的索引技术是实现查询优化最常用的重要手段之一。在查询优化设计中,充分考虑编码的索引技术,可以很好的实现对XML数据查询优化的需要。因此,结合编码与索引技术来对XML数据查询优化进行探讨,仍然是一个值得深入研究的课题。论文在二叉树遍历的编码基础上,引二叉树的三叉链表存储结构对XML文档结点进行编码。设计出一种基于二叉树遍历XML文档编码模式。该编码模式利用二叉树的三叉链表结构来存储XML文档树的结点,用自然数作为结点的编码序号。采用该编码模式作为XML文档树结点编码,选取合适关键词作为索引项,利用二叉排序算法为XML文档建立了相关索引模型。论文在传统区间编码基础上,利用倒排表和B+树作为基本的索引组织,设计出一个由DTD结构索引、XML文档索引和内容索引组成的联合结构索引模型。其中DTD索引采用倒排表作为索引基本单位,XML文档索引采用B+树来建立,内容索引则采用倒排表。在处理的查询时,只要通过一个入口即可以找到其它索引项来完成一个综合的多种查询处理要求。理论与实验结果分析表明,论文中基于二叉树遍历的编码模式,具有存储空间小和查询效率高,且支持动态数据更新操作。以此编码建立的索引具有空间开销小、查询响应速度快和查全率高的特点;以区间编码作为文档树结点编码,建立的联合结构索引模型,处理数据查询时具有较高查询效率,能够满足多文档查询的需求并且满足了对XML文档混合型优化查询(文本查询和结构查询)等需求。
其他文献
<正>何绍基字子贞,号蝯叟,湖南道县人,道光十六年进士,历官翰林院编修、四川学政,清后期著名的诗人、书法家。在书法史上,何绍基为继邓石如成功实践及阮元、包世臣理论鼓吹之
在金融危机背景下考察,金融犯罪呈现出以下新态势:金融犯罪新手段追随金融市场热点,与新兴金融业务如影随形;金融机构的"用户至上"主义衍生金融犯罪的空间;金融冒险成为金融
税收法定是财税法的基石性原则,统摄整个税法体系和全部税收制度。"有税必有法"要求关于税收方面的任何变化都需由法律明定。地方政府会议纪要在法律属性上是政府机关内部文
本文以文献资料为依据,从教学风格、学科建设思想和学问情怀三个方面对费孝通先生一生探索的榜样意义进行阐发。费先生在教学上倡导引导学生探求未知、从实求知的教学理念,在
要减少政府对竞争的不合理限制,需对各项法律制度的竞争影响进行评估。评估以不断被修正的SCP范式为依据。首先,基于这一范式所包含的影响竞争的因素,归纳出法律竞争影响核对
改革开放以来,我国经济和工业快速发展,也带来了严重的水资源的破坏和污染,许多大中城市的水环境污染问题和水资源短缺问题正日益突出。而水务行业就是一项集城市用水的取水、净
<正>编辑同志:白某因经营网吧急需资金,书写了恐吓信一封投放于其以前工作过的某公司,敲诈该公司经理朱某人民币十万元。次日白某因有他人愿意提供资金与其合股经营网吧以及
本文论述了桂林回坊的形成与变迁,并对民国以来影响其变迁的因素进行了分析。明清以来,穆斯林人口不断增加并逐渐聚居,具有民族特征的商业活动渐成规模,伊斯兰文化得以世代传
明代永顺土司所面对的主要问题,是如何在明王朝"以夷制夷"的政策下求得自身地方权力的巩固和稳定,联姻成为永顺彭氏家族势力扩展的最有效的策略之一。基于建构权力网络的需要
从行政法的视角来看,机动车限行常态化规定争议背后所体现的核心问题是,如何对现代城市管理中涉及行政专业化与复杂利益冲突的行政立法进行法律约束。我国现有的行政立法制度