论文部分内容阅读
查询重写作为数据集成中的一项核心技术,在集成或发布系统中有重要应用。随着Internet技术的发展,XML成为异构数据集成中的数据交换的中间形式,针对XML模式作为全局视图的查询重写成为集成系统中研究重点。本文在对国内外研究现状进行综合分析的基础上,对XML查询重写进行了深入的研究。
本文主要研究了基于中间件结构体系的集成系统中的查询重写,以及所涉及的技术和方法。
首先,分析了集成系统的体系结构以及所使用的重写技术,介绍了与查询重写相关的查询语言、映射和视图定义语言,重点分析了算法使用的映射语言的特点和蕴涵的约束信息。
其次,对采用XML作为公共数据模型的查询重写算法进行了深入探讨,提出利用数据源和目标模式之间的映射关系生成映射规则,对用户查询进行相应替换,得到针对各数据源的查询。
再次,为避免替换过程中产生不合理的查询,提出一种基于约束合并的改进算法。将用户查询分解成若干子查询,利用映射规则进行相应替换,根据约束条件进行有效的合并,得到最大被包含重写,以减少网络传输的代价。同时可以保证生成的重写尽可能的少,从而减小时间和空间开销,提高集成系统效率。
最后,结合自己的理论研究,设计了一个基于XML的异构集成系统的原型系统,对其中主要模块使用的技术进行了说明,并通过实验验证了文中所给算法的正确性和有效性。