论文部分内容阅读
近年来,随着互联网的发展和企业信息化进程的推进,国内各主要钢厂投入了大量的人力物力都先后建立起数量众多的信息系统。这些信息系统组成了一个信息库,通常信息库由很多信息源组成。但由于其开发的时间和部门都不相同,这些数据源在数据平台、数据库系统和通信协议上各不相同,并且不同的开发部门对相同知识的理解也存在差异,导致各系统之间不能共享数据。 随着企业对分布式环境下的异构数据互操作需求的增加,异构数据集成技术随之产生。异构数据集成的目的是屏蔽不同数据源的异构性,实现不同数据源之间的数据交换和共享,给不同用户提供同一个全局视图完成多数据源的透明查询服务。 本文主要对钢铁企业内部的异构数据集成进行研究,分析了现有异构数据集成系统中存在的问题,对比了几种典型的异构数据集成系统的结构,设计了基于本体的异构数据集成架构,并且详细描述了架构中的各模块的作用。此异构数据集成架构具有松散耦合、易于扩展、支持全局语义查询等特性。针对异构数据集成中的关键技术:本体构建、本体映射和查询处理,本文进行了详细的研究。首先,研究了局部本体和全局本体的构建。局部本体构建是从结构化数据源和非结构化数据源中提取语义关系,把数据库中的关系模式转换为本体模式。全局本体的构建是在领域专家的参与下对局部本体进行合并。其次,研究了全局本体和局部本体之间的映射,局部本体和底层数据源之间的映射。全局本体和局部本体之间的映射使用基于相似度计算的本体映射方法完成,其中相似度计算采用了多种策略保证正确性。局部本体与数据源之间的映射在局部本体构建时完成。最后,研究了全局查询中查询语句的解析、全局查询分解、子查询中RDQL到SQL的转化和局部查询结果集的合并。