论文部分内容阅读
科学数据库经过二十多年发展,积累了大量科学数据资源。如何对这些分布、异构的数据资源进行集成和互操作,成为一个亟待解决的问题。由于传统元数据以及异构数据集成技术的局限性,它们无法解决不同数据源的各个层次异构,这些问题与目前万维网所面临的问题非常相似。语义万维网(SemanticWeb)被提出用来解决这个难题,其希望以一种明确、形式化的方式表示信息资源,通过赋予异构数据以统一的语义信息,使得机器能够理解信息并自动处理信息之间的语义联系,从而提高异构数据之间的互操作性,促进知识共享。
本文的研究目标是利用语义万维网思想,赋予科学数据统一、规范的语义信息,实现异构科学数据库语义层次集成,使得科学数据库能够较好的共享和互操作,这是科学数据库系统从“管理数据”提升到“管理知识”的有效途径。本文首先简要介绍了研究背景,分析了传统元数据和异构数据集成技术存在的局限,提出利用语义万维网和本体相关技术是解决这些问题的途径;接着阐述了语义万维网及本体相关技术,并着重分析了国内外利用本体进行异构数据语义集成的最新研究成果;并提出一个科学数据库语义集成框架,讨论和分析了框架中涉及的若干关键技术,主要包括语义映射关系的建立、混合式适配器、通用本体图形化工具等;最后介绍了科学数据库语义集成原型系统,并对将来的工作进行了展望。
本文的研究成果主要体现在提出了一个科学数据库语义集成框架,对其中的若干关键技术提出了解决方案,并实现了科学数据库语义集成原型系统,为以后进一步的研究和应用奠定了基础。此外,在语义万维网体系框架内,通过将关系数据转化为计算机可理解和自动处理的RDF/OWL语义形式数据,实现了深层Web数据资源向语义Web内容的转化,这对语义Web发展具有重要意义。