基于XML树结构的索引技术研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:jmfxuexi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的主要研究内容有:对当前已经提出的各种索引技术进行了分析研究,首先给出了一个XML文档树数据模型的形式化定义。讨论了XML编码方法的研究和应用概况,并分析了当前比较流行的几种编码方法和结构连接的优缺点。同时在前缀数字编码的基础上提出了前缀字符编码方法的思想。然后将编码方法、倒排表和路径索引的思想相结合,提出了一种改进的XML路径索引方法,其中心思想是对路径索引树中的各个节点进行编码,能够快速判断XML文档树中节点间的祖先/后裔关系和双亲/孩子关系,有效的支持XPath路径表达式查询和关键字搜索,不需要进行大量的结构连接操作,从而提高XML路径查询的效率,同时给出了两个连接算法。最后对基于序列的XML索引技术进行了分析和研究,指出了由于同名兄弟节点的存在,导致了假警报,出现了查询不等价问题。提出了基于约束序列的XML索引方法,给出了约束的一系列定义和引理通过引入约束匹配,消除了歧义,并能保证结构匹配和子序列匹配的等价性,并证明了定义、引理的正确性,分析了算法的性能。提出了利用模式信息和统计技术来提高约束匹配性能的思想。
其他文献
学位
随着计算机的计算性能与存储能力的发展,各类实验产生的数据量也与日俱增。在这种情况下,一个现实的问题也开始摆在我们的面前:如何应对和处理爆炸般增长的数据?通常来说,数据
随着局域网交换技术的迅速发展,VLAN技术越来越受到广大用户的关注,尤其是其灵活的组网技术,有效地减少了网络中因站点移动和改变带来的管理开销。但VLAN管理的复杂性,又在一定程
论文在研究国内外仿真技术的现状的基础上,首先给出了当前图形仿真的几种传统方法,较为具体地论述了各仿真方法的基本原理,并指出它们在工程实践中难以推广应用的原因;简单介
随着互联网络的发展和无线手持设备的广泛应用,移动IPv6将在未来的3G和后3G网络中扮演非常重要的角色,越来越受到人们的关注。移动IPv6的安全成了移动IPv6研究中的焦点问题,移动
光与颜色是人们感受自然万物的基础,而被称为颜色的“指纹”的光谱反射曲线记录一个颜色最详细的信息,直接保存、处理颜色的光谱数据能够得到最为精确的结果,因而具有重要的
  本文根据智能控制与模式识别理论各自的特点和结合应用的意义,结合知识发现和知识优化的原理,利用粗糙集理论对知识能有效分类的特点,将粗糙集理论应用到知识发现中,提取出有
入侵检测系统是计算机网络安全的重要组成部分,它实现对入侵信息实时检测的功能。入侵检测系统一般采用基于网络的,采用误用检测技术的。采用误用检测技术的优点是精确;但它的主
信息化浪潮正深刻、全面地影响着我国经济发展的各个领域,对出版行业也不例外。出版业作为意识形态领域一直受到国家的重点保护,信息化建设薄弱。加入WTO后,在经济全球化、信息
  随着信息的爆炸性增长,对计算机的存储能力提出了更高的要求。海量信息的存储带来了另一个问题,信息怎么进行有效的处理。这就对计算机的计算能力提出更高的要求。使用单一