论文部分内容阅读
随着XML数据在互联网络上应用的不断增长,对庞大的XML数据流的查询正成为数据查询领域内研究的热点。XML流的查询问题主要归结到XPath的查询,而如何高效的处理XPath表达式中的谓词则是XPath查询研究中需要解决的关键问题。将自动机技术引入到XPath查询领域,解决谓词处理中的难题是目前国内外研究的重要方向之一。本文首先对自动机技术在XPath查询中的应用进行了研究,而后提出了一个基于交错自动机(AFA)的XPath处理模型XBA。XBA对AFA的转移函数进行了改写,充分利用AFA表达and/or语义的特性处理谓词,并采用逆向分析的方法构造转移函数,减少了自动机运行中产生的中间状态数。实验结果表明XBA可以提高XPath表达式中谓词处理的效率。在论文的最后,针对XPath表达式中由于出现表示节点间不确定语义的标识符“//”和“*”,而造成转换状态增加、降低查询效率的问题,提出了一种基于XML Schema的逻辑优化技术,它利用XML Schema的约束使XPath表达式确定化。理论分析和实验结果表明,优化后的XBA处理效率高于优化前的效率。