论文部分内容阅读
数字图书馆是一个没有明确边界的研究领域,关注的是对一个有组织(或称为有序)的信息体的构造,不论这个信息体是分布的还是集中的、虚拟的还是实在的,以满足特定的信息需求,不论这个需求来自真实的用户还是机器代理。数字化和网络化,特别是近20年来互联网的指数级发展带来了严重的信息超载(Information Overload)。为了更好地组织信息,满足人们的信息需求,数字图书馆应运而生,然而要从根本上提高数字图书馆对大规模分布式信息的处理能力,准确而全面地提供信息服务,有赖于机器对网络信息的自动处理和“理解”能力。因此实现语义信息的组织和检索,是一个很有前途的突破口。 “语义”指“信息的含义”,“互操作性”是不同平台或编程语言之间交换和共享数据的能力。解决异构信息环境中信息系统之间的高层互操作问题是数字图书馆的一项重要研究内容,而语义互操作是其中的重点和核心问题。这并不是说目前的互操作解决方案中没有考虑语义互操作,而是没有把语义互操作当作独立的目标来考虑。本论文提出对于数字图书馆须定义和设计一个独立的语义互操作层,使数字图书馆所包含的信息资源获得语义的“显性”化,而不是隐式地、内含地包含在语法和具体的系统实现中。 本文研究的内容主要包括两个方面:针对数字图书馆的体系结构和互操作需求特点,将本体论作为语义描述和实现语义共享和互操作的基础,提出了一种以规范的元数据表述和本体服务架构的表示模型和数字图书馆语义的结构化、形式化方法,并研究了相关策略和理论;同时针对数字图书馆资源集成和服务集成的特点和需求,以及现有各类互操作协议,提出了一种基于SOA的语义Web服务架构,并根据该模型架构提出了一套具体操作方法和策略。本文以集成模型为基础,以面向对象模型进行数字图书馆的语义表示,以元数据和本体作为共享的基础,将资源的组织、结构与服务模型有机结合起来,本文的主要特点如下: ● 在总结数字图书馆互操作现有技术和模型的基础上,提出了基本的语义互操作需求,研究并设计了一套数字图书馆语义结构模型,并总结了其表示和实现形式,为数字图书馆语义的提取和形式化表示提供了框架。 ● 提出规范的数字图书馆语义化方法,包括规范的元数据方法和本体模型的建立方法;采用结构化、层次化方法对数字图书馆语义信息进行组织和存储。所提出的资源集合(站点)元数据方案正在申报作为科技部标准。 ● 对于应用Web服务实现基于本体的语义互操作服务,包括语义模型的动态映射、转换和服务合成,提出了一套实施架构,并提出两种具体的操作方法可以应用于建立数字图书馆语义架构:自底向上法和自顶向下方法,前者通过各类语义规范的实施应用于建设全新的具有语义互操作层的数字图书馆,后者通过语义抽取、标注等方法应用于对目前提供网络服务的各类资源集合和数字图书馆进行资源集成和服务集成。 ● 在一个应用实例——名人手稿数字图书馆的体系设计和系统开发中建立了基于本体的语义互操作原型,实现了规范的语义描述架构和基本的与其它数字图书馆和资源库的语义互操作。 本文的研究从对数字图书馆宏观结构模型和微观数字对象模型的探讨出发,以形式化、外显化的元数据和知识本体为要素构建数字图书馆语义架构,作为实现数字图书馆语义互操作的基础。在大量调研现有理论模型和方法论的基础上,将资源的组织、结构与服务模型有机结合起来,对数字图书馆的结构模型在语义表示方面进行了许多扩展,对元数据资源及资源集合描述术语体系、元数据和本体的形式化表示、基于Web服务的数字图书馆语义服务的架构等方面提出了一套较为完整的方案。对于数字图书馆系统的创建或信息与服务集成,本文所研究的理论和技术提供了一个具有普遍意义框架模型,并为深入研究,完善各类基于语义的自动服务提供了一个可行的起点。