论文部分内容阅读
网络和数据库技术的不断发展使很多企业和机构实现了信息的计算机管理,在提高效率的同时积累了大量的数据。这些数据往往具有分布性、异构性和自治性的特点,相互之间难以共享和交流。如何对这些数据源进行集成,向用户提供统一的查询接口,是当前急需解决的问题。传统的数据集成技术可以较好的解决不同数据源间的系统异构及语法异构,但解决语义异构的能力较弱。本体作为共享概念模型的明确形式化说明,为解决语义冲突提供了一种有效的手段。本文为了更好的解决数据集成中存在的语义异构问题,引入了本体,提出了一个改进的基于本体的异构数据源集成解决方案,并对其关键技术进行了实现。本文的研究内容如下:(1)阐述了异构数据源集成的研究背景,分析了集成中面临的主要问题,归纳了当前的研究现状和涉及的相关技术。(2)针对不同数据源间存在的异构性,提出了一个扩展的基于混合本体的异构数据源集成框架,并对其主要模块及工作流程进行了介绍。(3)通过引入本体,解决多个数据源集成中存在的语义异构问题。采用局部本体描述单个数据源的语义,建立全局本体作为全局数据模式来对多个数据源中的信息进行统一的描述,定义全局本体与局部本体间的映射解决集成中存在的语义异构问题。(4)根据全局本体与局部本体及局部本体与数据源模式之间的映射规则,使用改进的两级查询重写算法,将用户提交的基于全局本体的中介查询分解转化为针对各局部数据源的子查询;设计了用于查询执行和结果转换的数据源包装器,并将其中的功能接口封装为Web服务;使用WSDL文件描述该服务后在集成系统的UDDI注册中心进行注册发布,使得中间层能够方便的查找和调用这些服务,并从中返回查询结果。(5)结合本文提出的关键技术,对基于本体的专利数据源集成系统进行了初步的实现,并对系统的有效性进行了验证。