XML结构完整性约束及其应用研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:xiaotang111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上大量XML数据的出现,人们越来越希望以对待数据库的方式管理和查询XML数据。为了增强XML数据的语义能力,国内外许多学者都致力于用传统的完整性约束扩展XML模式体系,比如键、外键、函数依赖等。这些完整性约束规定了XML文档中节点之间的值关系,在XML模式规范化设计方面起着重要作用,但它们不能表示XML文档中节点或路径之间的结构关系。作为XML文档的主要模式,DTD和XML Schema定义了XML文档中允许出现的元素、元素嵌套关系、属性及它们之间的顺序,但它们也不能处理节点或路径之间复杂的结构关系,而这种结构关系为XML查询提供了更多的优化机会。既然XML查询语言的共同特征是使用路径表达式来导航XML查询并返回指定路径的节点集,那么路径表达式的高效执行就成为XML查询优化的重中之重。虽然学者们在路径表达式查询优化方面已取得大量的研究成果,但这些成果中都没有或者仅考虑了少量的XML约束。在前人工作的基础上,本文为XML文档引入一个比较完整模式体系——XML结构完整性约束(XSICs),并研究了XML结构完整性约束在XML路径表达式逻辑优化中的应用技术。本文的主要研究成果及创新点如下:  (1)给出了一个XML结构完整性约束体系。这个体系全面描述了XML文档中节点或路径之间的结构关系,包括必需性包含、排他性包含、路径蕴涵、路径互斥和路径同现;为了既能满足路径表达式逻辑优化的需要又便于推理证明,路径约束的定义是基于线性路径表达式的。  (2)作为一个独立的模式体系,研究了XML结构完整性约束的逻辑蕴涵和一致性问题。采用约束重写技术将各种结构完整性约束改写为路径蕴涵约束的形式;基于子路径的概念,给出了一组路径蕴涵的推理规则,证明了规则的正确性;借鉴关系数据库中函数依赖闭包,提出了路径蕴涵闭包的概念;以此为工具证明了推理规则的完备性,给出了XML结构完整性约束的逻辑蕴涵和一致性判断方法。  (3)基于子路径的概念,提出了一个路径表达式查询的逻辑优化算法。在没有任何约束的情况下,该算法可以有效地识别和删除路径表达式中的冗余谓词,其时间复杂度为O(n2)。在有XML结构完整性约束情况下,优化算法以路径蕴涵闭包为主要优化工具,不仅能对路径表达式进行最小化还可以有效识别无效路径,且不需要用约束chase查询,其时间复杂度为O(n|∑|2),其中,n和|∑|分别为查询和约束集的大小。此外,优化算法把路径表达式查询分解为线性路径表达式,通过判断线性路径表达式之间的子路径关系来识别查询中的冗余谓词,这种分解操作降低了包含测试的难度,使得算法易于扩展到有通配符的路径表达式。实验证明了算法的正确性和有效性。  (4)针对路径分解法和整体小枝模式匹配法,提出了基于XML结构完整性约束的线性路径表达式的缩短策略。本文的路径缩短策略可以看成是已有路径缩短策略的扩展,不仅可以将绝对路径缩短为相对路径,而且可以有效地删除线性路径表达式中冗余步。  (5)提出了使用XML结构完整性约束扩展DTD模式的方法,在此基础上,研究了DTD模式下的XML结构完整性约束的逻辑蕴涵和一致性判断问题,给出了使用扩展的DTD优化路径表达式的一般步骤和方法。与已有的研究方法不同,本文使用DTD模式子树扩展集来扩展DTD的约束能力,研究表明DTD模式子树扩展集蕴涵了DTD和XSICs中的全部XML结构完整性约束。  
其他文献
该文提出了一种面向事务处理的确认测试控制方法,其核心是实现事务处理流程的形式化.该方法在数据流图规范化的基础上引入了数据流事务的概念,并将有限状态机作为控制原语,使
该文第一部分根据了两层C/S模型的优点及存在的缺陷.第二部分分析了三层C/S模型的体系结构,总结了三层C/S模型的中间层-应用服务器的特点,并提出了一种通用的应用服务器模型.
网络计费管理是Internet管理中不可缺少的方面.该文提出的是一个基于路由器的计费系统.对其设计和实现进行了详细的阐述.在该计费系统中,操作系统平台采用Windows NT4.0Serv
目前,随着Internet的迅猛发展,传统的商业正在发生着迅速的变化,利用Internet进行商业活动已经成为大势所趋.然而,由于电子商务包含的内容涉及面相当广,要充分发挥电子商务的
该文介绍了彩色电子出版系统中彩色图像输出需要解决的几个关键技术:灰色、校色技术和挂网技术.文中首先简单介绍了彩色电子出版系统的组成和需要解决的技术,然后针对实际情
基于特征参数化设计系统支持广义几何特征的参数化,支持特征线性修改和特征的非线性修改,支持面向装配的特征设计.该系统使产品设计和修改与其历程树无关,大大提高了期产品设
该文对泥浆中超声测距遇到的一些问题的产生原因和解决措施进行了分析和探讨,从理论上分析了在方波调制脉冲激励下的超声信号随时间的变化规律,设计了超声发射及接收电路,采
该文对2值Bent函数进行了研究,取得了下列新的结果.一、综述了Bent函数的发展过程和主要成果;二、提出了一种构造Bent函数的新方法,依此可定出大量新的Bent函数;证明了一些二
人脸识别是图像处理和模式识别领域的一个研究热点,它涉及到模式识别、图像处理、计算机视觉、机器学习等多个学科领域,人脸识别在国家安全、公安系统和城市的公共安全等方面有
该文从作战训练模拟系统的应用领域和系统开发角度,论述了海军战术综合训练模拟系统的设计和实现.首先,论文对分布式计算技术和面向对象技术进行了深入的分析和研究;然后,运