论文部分内容阅读
随着企业的信息化建设以及网络的发展和普及,大量的异构数据源应运而生。为了更好地利用这些资源,人们迫切需要解决这些异构数据源的集成问题。异构数据源集成的主要任务就是屏蔽底层异构数据间的差异,实现对不同的异构数据源的信息共享,使得用户可以无缝而且灵活地访问这些异构数据源。
本文在研究了异构数据集成的相关理论和技术的基础上,提出了一种基于中间件的Mediator/Wrapper集成框架的异构数据源集成系统HDSIS( Heterogeneous Data Sources Integration System)。在该体系结构中,采用XML技术解决语法异构问题;利用本体描述精确语义的优势,使用本体描述语言OWL(Web Ontology Language)描述全局本体和局部本体,并通过全局本体到局部本体的映射,解决数据源间的语义异构问题;采用Web Service技术屏蔽数据源间的平台差异,解决异构系统的互操作问题。
在HDSIS框架下,实现了异构数据源集成原型系统,并将其应用到一个在线零售商联盟销售系统中。客户端提供给用户一个全局查询接口,实现了集成查询的功能。服务器端则实现数据源注册、集成任务定义、系统管理等功能。
本课题的研究内容如下:
(1)异构数据源集成系统的总体设计。针对异构数据源集成过程需要解决的问题,设计出异构数据源集成系统的体系框架,详细设计其中每一个模块的功能,并对其中的关键模块进行实现。
(2)保留约束及语义信息的关系数据库模式到XML模式的转换。本文采用XML Schema定义集成模式,将异构数据源统一转化为XML Schema,使系统具有更高的灵活性和良好的扩展性。
(3)利用全局本体/局部本体映射的集成方案,解决数据源语义异构问题。
(4)针对数据源进行的全局查询分解算法。
(5)利用Web Service和SOAP技术解决异构系统的互操作问题。其中,各个异构数据源被封装为Web Service,使系统具有松耦合和易扩展的良好特性,能真正实现异构数据源的无缝集成。
本文工作的意义在于通过HDSIS系统,提供了一个统一且透明的集成查询接口,为数据共享、数据分析、决策支持等应用提供支持。