基于前缀编码XML查询新策略的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:runqiusheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML正迅速取代HTML成为Web上信息表示、集成和交换的标准。与HTML相比,XML具有简单、自我描述的特点,并且实现了内容、结构和表现三者的分离,更适合于Internet上数据表示和交换。近年来,XML在各种领域得到了广泛的应用,Web上,信息系统以及电子商务中涌现了大量的XML数据。XML逐渐成为信息数据表现和传输的标准。有效地加工、分析,处理和存储XML数据成为目前XML方向研究关注的热点问题,研究者们已经提出了多种XML的查询语言和存储管理技术。而目前,在存储管理XML各种可能的方式中,基于关系的XML数据处理是一种可行而有前景的方式,受到了广泛的关注。但是基于关系存储的XML数据在处理XML复杂路径表达式查询时需要对多个子查询的中间结果作结构连接,这就需要在多个关系表上进行连接计算以实现结构关系的判断。这将导致XML数据查询所需要的I/O时间和计算工作量增加。而前缀编码各段字典有序性,其编码算法比较简单,不但可以很好保存双亲/子女,祖先/后裔结点之间的包含关系,更可以保存XML文档中结点之间位置关系的信息,因而可以成为方便的比较XML文档中任意两结点位置关系的工具。利用前缀编码这些良好的特性,本文提出一个利用前缀编码来支持XML数据查询的新策略。在这个策略中,本文提出一种最长前缀编码匹配的策略。对于基于关系存储的XML数据,在其处理复杂路径查询表达式时,利用最长前缀编码匹配算法,我们可以对XML数据查询中结构连接所得到的中间结果集合进行筛选,通过最长前缀编码匹配策略直接得到XML数据查询所要的最终结果。相对于传统的基于关系存储的XML存储查询策略,在处理复杂XML路径查询时,本文的策略更加高效。为了支持最长前缀编码匹配策略查询XML数据,根据XML路径查询表达式的两阶段查询特点,本文也给出了相应的两种模式级别的XML数据存储策略,并阐述了在这种存储模式下具体的XML数据的查询过程以及和其他模型查询性能分析的对比,并介绍了实验情况和实验结果。为了更好的理解本文,本文还在开始简要的介绍了XML相关的知识和理论,XML查询技术,XML编码方案以及现有的几种典型XML数据库技术。
其他文献
随着嵌入式系统的广泛应用及发展,越来越多的嵌入式系统开始采用了操作系统。然而,嵌入式操作系统的安全性却始终被忽视,而与此对应的是越来越多的针对嵌入式系统的攻击。因
随着互联网的飞速发展及分布式计算的广泛应用,越来越多的分布应用系统通过目录服务实现网络资源的发布与查找。目前国内的目录服务大都参照X.500系列协议或LDAP协议进行实现
近年来,XML(Extensible Markup Language)己经成为互联网上数据发布和数据交换的事实标准并受到越来越多的关注。虽然XML查询技术己经取得一些研究成果,但由于XML文档自身的
虚拟机迁移是云计算中云云协作所需的关键技术,经典的虚拟机迁移策略在局域网环境中能很好地工作,如预拷贝迁移策略和后拷贝迁移策略,但广域网环境中网络带宽低且不稳定,传统
当今,全国各大城市正在大力发展城市公共交通事业,公交专家系统成为提高公交系统信息化、现代化的重要措施。公交专家系统在公交调度、线网优化方面都应该发挥其重要作用。蚁
人脸识别的理论与技术是近二十年来最为热门的研究领域之一。尽管人脸检测和识别方法取得了巨大发展,但是可变光照对人脸识别的影响,无论在理论、方法还是应用上,仍是一个亟待解
信息社会中手机及其它无线设备越来越多地走进普通老百姓的工作和生活中。现阶段的手机平台上的输入方法主要分为人工编码键盘输入法和手写识别输入法,无论哪种方法对于汉字
分形的概念是1975年由IBM公司的曼德尔布罗特(B.B.Mandelbrot)定义并开始发展的,分形理论作为从复杂的现象本身直接研究到其内在所具有的规律,它可描述自然界复杂的现象。如
无线局域网(WLAN)是目前无线网络技术的研究热点之一。由于支持用户高效率、高质量、低成本的移动接入,因此得到了非常广泛的应用,但同时开放的无线传输带来了比有线网络更多
随着世界经济一体化进程的加快、大型跨国企业的进入使民族产业所面临的局势更加严峻。如何应对挑战,各级政府部门和许多市场意识敏锐的企业已经将物流作为提高市场竞争力以