基于XML结构性约束的模式树查询最小化

来源 :山东大学 | 被引量 : 0次 | 上传用户:lt13770509399
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用技术和电子商务的快速发展,企业可获取的信息数量和类型有了极大的增长。由于XML的可扩展性、结构性以及平台无关性的优点,XML已经成为Intemet数据交换事实上的标准,在Web中得到广泛应用。如通过Web搜索引擎找到XML是自然而然的事情。在搜索引擎查找符合特定条件的XML文档时,即针对于XML数据库的进行查询。因此XML的查询优化具有巨大的商业意义,成为目前研究的热点。XML是专为Web设计的,把XML看作Web世界中的数据模型,目前流行的XML数据模式有多种,如DTD,XML Schema,RELAX NG等。定义XML数据的模式时,常遇到这样的情况,如定义的XML出现了某种形式的结构时,必然有另一种形式的结构同时出现,这便是一类基于XML结构的完整性约束。DTD是一种基于语法的XML规范形式化定义,在考虑结构完整性约束时,一种基于pattern的XML规范形式化定义XSCs模式可以与其联合使用,使得生成的DTD具有更为丰富的语义。模式树是对像XML和LDAP等树形结构数据进行查询的基础。在树形结构数据库上进行树模式匹配的效率取决于模式树的大小,因而尽快发现和删除模式中的冗余节点就显得十分的重要。模式树查询最小化问题,经证明是NP-Hard问题。在本文中,我们研究引入XML结构性约束时的XML模式树查询最小化问题。具体来说,我们将在XSCs模式下,基于几种路径的结构性约束,实现模式树查询最小化。解决该问题的关键技术由Chase技术和删除冗余节点算法两部分组成。首先,我们使用Chase技术对给定查询对应的模式树进行扩展,利用已知的结构性约束,在不改变查询结果的前提下在模式树中增加节点,得到与原模式树查询等价的一棵新的模式树;然后,利用约束独立情况下模式树查询最小化算法,删除Chase阶段生成的模式树中的冗余节点以及在Chase过程中产生的新节点,得到最终的模式树,此模式树对应的模式树查询即为原查询等价的最小化查询。本文中我们提出的XSCM算法就是基于以上思路。经分析,该算法的时间复杂度为多项式时间。实验结果表明,与XML查询的一般方法相比,XSCM在查询的数据量较小的情况下差别不大,但是查询数据量越大,查询效率越高,优势越明显。XSCs模式是针对XML数据模型定义了一些常见的基于结构的完整性约束,然而,还存在一类基于值的约束,基于值的约束在现实生活也是很常见的,所以未来的工作我们将致力于基于XML值的完整性约束下的模式树查询最小化,从而将XML模式树查询最小化问题扩展到更加广泛的应用范围。
其他文献
随着计算机及其相关技术的发展,通信能力和计算能力的价格正变得越来越便宜,各种新形念的传感器所占用的体积也越来越小。由于对生产效率、生活质量的不懈追求,人们开始希望能随
近年来,无线通信和电子技术的不断进步,促进了微型无线通信传感器节点的长足发展。由这些低功耗、多功能的节点所构成的无线传感器网络具有十分广阔的应用前景,目前已成为计算机
数据挖掘技术是从上个世纪80年代开始发展起来的一门新技术,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是
随着网络技术的不断发展,互联网的普及率以及网民的数量的不断攀升,给人们的学习和日常生活带来了极大的便利。与此同时,针对网络的攻击手段日益复杂,网络攻击软件日趋多样,网络安
随着计算机和网络技术的飞速发展,计算机安全问题日益突出。入侵检测是计算机安全体系结构中的一个重要的组成部分。目前入侵检测系统的研究已经有了长足的进步,开发出了许多
脱机手写体汉字识别由于其字符集庞大,字形变化多等特点成为模式识别领域一个极具挑战性的课题。它将在信函分拣、银行支票识别、统计报表处理以及手写文稿自动输入等诸多方面
访问控制是保护信息资源的一种重要机制,通过对用户访问行为的限定从而达到保护敏感信息的目的。因此,实施合适的访问控制是构建安全信息系统的基本要求。访问控制通常依据一
共享存储多核多级Cache结构已成为高性能计算领域通用的处理器架构。虽然多级Cache结构能够有效缓解“存储墙”,但在科学计算程序中,访存指令占有较大比重,访存效率仍然很低,
同一场景的两幅或多幅图像的匹配是计算机视觉中的一个重要领域。在目前的匹配方法中匹配的准确率和匹配的性能是一对矛盾,所以选择对于图像噪声,3D视角变换、遮挡以及亮度变化
虚拟机技术在企业服务器整合、多执行环境、计算机安全、系统调试、灾难恢复等领域具有很高应用价值,是当前热点技术之一。在众多虚拟机技术中,XEN具有开源、高效的特点,近年来