论文部分内容阅读
随着网络和分布式应用的发展和普及,大量的异构数据源应运而生。而异构数据面临着分布性,自治性,运行环境,语法以及语义异构等问题,因此它们不是真正意义上统一的可直接利用的信息资源。为了更好的利用这些资源,其中要解决的关键问题之一就是异构数据的集成和共享。
异构数据集成的任务就是通过给用户提供一个统一的应用平台,从而屏蔽底层数据源的不同,使得用户可以无缝而且灵活的访问这些异构数据源。本文在分析分布式异构数据特点和当前数据集成方法的基础上,对如何在语义层上实现异构数据集成进行了研究。这些研究包括了基于本体的面向服务的数据集成模型的提出,服务工厂的设计,语义标注,查询处理,服务管理等内容。所做的工作和创新点主要体现在以下几个方面:
1.采用面向服务架构的思想设计服务工厂,实现了web服务的自动生成。服务工厂根据预定义的模版以及用户给定的查询条件定制方法并生成相应的web服务。模板是预定义的,从原理上说可以定制用户所需的任何模板。具有很大的灵活性和良好的可扩展性。
2.支持不同数据源的语义标注,提出一种本体到数据源间的映射方法,解决了在基于本体环境下多数据源的绑定问题。语义标注使用统一协议标准,使更加规范和易于机器理解。语义标注是可扩展的,提高了数据集成能力。
3.在模型的查询处理部分设计数据源查询分解,查询重写方案;查询重写算法将对本体的查询转化为对数据源查询。用OWL来描述本体,使用Jena的本体推理功能进行语义推理。
4.设计完成了一个基于本体的面向服务的数据集成实验系统OWSIS(Ontology-based WebService Integration System),该系统引入本体来解决数据源在语义层上的异构,验证了基于本体的面向服务的方式用于数据集成的有效性和相比其他方式进行数据集成的优势。