论文部分内容阅读
近年来,随着数据库技术、Web技术的快速发展和信息技术应用的快速深入,大中型企业和公司纷纷建立起庞大且复杂的IT信息集成系统,同时也累积了大量的满足各自业务需求的数据源。通过改造和升级原有系统已不能满足全球化公司飞速发展的业务需求,重新开发新系统需要耗费过多的人力和财力,而且会丢失原有的数据信息。企业对这些异构数据源系统的整合需求持续增强,数据源集成就成为了企业信息化过程中亟需解决的关键问题。异构数据源集成的目的是提供给用户访问多种数据源的统一接口、一个集成处理多种数据源、整合多个数据查询结果的信息交互处理平台,从而屏蔽它们的平台、系统环境、内部数据结构等方面的异构性,使得用户不必考虑数据源的位置、数据抽取和合成等问题,就可实现数据集成、共享和有效一致的信息查询。XML已经成为互联网上信息表示和数据交换的一个重要标准。在分析异构数据源集成系统结构的基础上,本文采用Mediator-Wrapper的方式集成异构数据源,它使用XML数据模型作为集成系统的公共数据模型,可以集成包括XML-Enabled关系数据库系统、Html、Excel、Web信息系统、Native-XML数据库等多种异构系统中的数据。为了建立集成系统中不同模式层次之间的联系,本文提出了输出模式到全局模式的全局映射以及局部模式到输出模式的局部映射方法,解决了异构数据集成平台模式与底层数据模式之间的映射问题。查询处理是异构数据源集成系统的关键技术之一,而查询分解和查询优化是集成系统中查询处理的核心技术。本文首先阐述了一种基于Mediator-Wrapper中间层的异构数据源集成系统框架,然后对XQuery查询处理过程特别是查询处理的关键问题,如查询分解和优化技术做了深入研究,提出了一个查询分解算法并结合实例进一步说明了异构数据源集成系统中查询分解和优化的具体实现。