论文部分内容阅读
随着Internet的快速发展,尤其是Web服务技术、电子商务等的广泛使用,XML作为一种自描述的半结构化数据模式已成为Web数据表示和交换的新标准,越来越多的信息处理系统采用XML文档作为信息存储、交换和发布的载体,XML类型的数据已成为当前主流的数据形式。有了XML和Web services,在网络上分布信息变得很容易。XML和Web services正在成为有价值的动态的更新信息资源的标准。这些标准的急速扩展必然导致新一代XML文档的产生,即Active XML文档。Active XML定义为一种分布式信息管理语言,是对XML的扩展,其主要思想是在XML文档中嵌入Web Services调用,实现对Web Services资源的动态访问,但语法上仍是有效的XML文档。一个Active XML文档包含两种信息,在文档中直接表示出来的数据称为“显式数据”,以Web Services调用表示的数据称为“隐含数据”。由于XML文档中引入嵌入式Web Services,增加了文档的动态性和灵活性。然而,也带来了诸多新问题,如文档重写、Active XML文档查询、文档包含及服务调用可终止性问题等。本文结合树形有限自动机的特点,分析和研究了目前解决XML的重写的方法,根据Web Services的相关标准,提出了基于树自动机技术的解决Active XML重写的处理方法。该方法通过将Active XML文档定义成树,并把Active XML文档或模式中的函数结点或数据结点定义成树自动机中的状态结点,根据对这些带有函数标签的状态结点,通过算法进行检测,看是否在文档或模式重写时能完全的符合目标模式,有效地实现Active XML的完全重写。本文通过利用计划排产中的实例,对本算法进行了阐述。最后对本文涉及的方法进行了性能测试,实验结果表明树自动机技术可以有效地解决AXML文档的完全重写问题,而且提出的新方法在计划排产的性能上要优于传统方法。