论文部分内容阅读
随着科学技术的迅猛发展,网络与人们的日常工作学习已经密不可分,人们对网络的普遍使用促使了很多新生技术的发展。比如Web日志、金融分析、网络监控和安全、传感器网络、电信数据管理、生产制造、图书订阅、位置搜寻、在线拍卖、股票信息查询等这类密集型的数据的广泛应用,也引起了很多学者的关注,促使了数据流的查询处理技术的快速发展,同时也引起了研究界的浓厚兴趣。这类数据的特点是:数据量大,而且流过服务器的速度非常快、数据流是在线到达的、达到的顺序也是不可控制的,由于其数据量很大,所以无法实现数据的存储,但是相对数据的不确定性,查询却是持久存储的。显然,可以看出如果利用传统的管理方式,像管理传统的数据库管理系统一样,对这样类型的数据进行存储,想根据某一时刻稳定的查询计划得到精确的查询结果,不符合实际需求。这类数据类型并不支持连续反复的查询,然后连续查询恰恰是数据流的典型特性。XML数据流的查询和管理技术成为目前数据流领域专家们研究的热点问题,这类数据的特点决定了它们不能用持久稳定关系建模,同时如何高效的为数据流建模也是专家们要解决的关键。在Internet环境中运行着XML数据流得处理系统,在该环境下存在着海量用户,这些用户利用XQuery语句描述其需求,XQuery语句的核心是XPath式,XML流的查询问题主要归结到XPath查询,如何在XQuery中提取XPath式,如何利用XPath表达式高效的查询XML数据流是数据流查询中需要解决的关键问题。将XML更新流的概念引入到XPath查询领域,解决无法进行连续精确查询的问题,这是课题的主要研究内容。针对在XML流上执行XQuery查询处理,获取精确输出查询结果的问题,结合了XML更新流和XQuery处理技术特点,给出了一种基于XML更新流的解决方案。在XML流中动态地插入更新事件,得到XML更新流,以达到获取连续精确的结果。XQuery查询语言在XPath路径查询的基础上使用FLWOR表达式实现XML数据流的复杂查询。将主Xpath式进行提取,分出绝对路径和相对路径,把有依赖关系的路径进行合并,重写FLWOR表达式,结合自动机技术提高XQuery的查询效率。实验结果表明,提出的方法能够提高执行效率,得到精确的查询结果。