论文部分内容阅读
数据库系统已经成为现代人们进行信息管理最常用的手段。随着商务网站之间电子商务的发展,异构数据库间的数据交互日益频繁,新兴的可扩展标记语言逐步展现了其在数据存储、数据交换等领域的显著优势,迅速成为一个与平台无关、厂商无关的数据格式标准。通过为各商务网站现有的不同数据库系统提供一个XML接口,外界就可以借助XML实现对任何平台下的现有数据库的访问,并将访问结果以XML的形式输出到其它平台,从而实现了异构数据库间的信息交换。
本文研究了异构数据集成的相关理论和技术,对现有数据集成方法进行分析,结合Wrapper/Mediator体系结构,提出了一种可扩展的异构数据集成框架XHDI(XML-basedHeterogeneous Data Integration)。本文的主要研究工作如下:
1.设计出了异构数据集成系统体系框架,详细设计了框架系统各模块的功能,并对框架系统的关键模块给出了应用实例。
2.采用XML作为中间语言,将局部数据源数据转化为XML数据进行集成,屏蔽底层数据源的异构性。利用本体描述领域概念的优势,采用本体描述语言OWL构建全局本体和局部本体解决数据源的语义异构。
3.采用XQuery作为全局模式上的查询语言,便于查询分解和优化,也容易将XQuery表示的查询转换为SQL语句。
4.将各个异构数据源封装为Web服务,屏蔽数据源的平台差异,对各类数据源的抽取、封装和远程调用,实现了更大范围内的数据集成,使框架系统具有松耦合、灵活、易扩展的良好特性,实现异构数据源的无缝集成。
在XHDI框架下,用一个典型的测试用例对本文提出的方法进行了验证,通过全局本体和局部本体映射,提供一个全局查询接口,并实现了异构数据源数据的集成。