论文部分内容阅读
在知识经济时代,知识的重要作用和价值日益受到重视,而知识的快速增长、知识资源异构化等问题又为开展知识服务带来了诸多挑战。在众多的知识资源中,数字文献资源是科学研究人员发表和获取最新的学科知识与学科研究动态的重要途径,是知识内容的重要载体。数字文献资源的组织、利用和服务,是知识服务的重要组成部分,其服务能力的提高,也是提升整个知识服务水平的关键之一。传统的数字文献资源的组织与服务模式较为单一,只能实现简单的检索;近年来,随着本体技术的发展和广泛应用,本体的理念和方法被引入的数字文献资源的检索中,但鲜有将数字文献资源的计量关系与语义关系两个角度相结合开展数字文献资源语义标注与聚合的研究。本文的研究正是要弥补这一不足,实现基于两种角度相结合的本体的构建和知识库系统的构建。本文秉承“理论研究与应用实践相结合”的原则,从理论探索、复合本体的提出与构建、知识库的设计与构建、实证研究等方面系统地开展基于复合本体的学科知识库构建研究。本文的内容框架除了引言和总结与展望外,主要分为五大部分,每个部分各为一章:第一部分(第1章),对理论基础的梳理和探讨。首先重点阐述了本体的内涵与作用、主要的本体描述语言和构建工具、本体的构建原则与方法、本体的复用等问题,为选择合适的方法、思路和技术构建复合本体提供理论依据。其次,概述了知识的类型及其形式化表示的相关理论、知识库的作用、知识库与数据库的异同,以及知识库的类型,以便在后续章节中为本文研究的学科知识库的界定提供理论支撑。最后,在以上内容的基础上,对本体应用于知识库中的作用、二者的关系、基于本体构建知识库的关键问题和技术、基本流程等问题进行了分析。第二部分(第2章),提出复合本体这一概念并从理论和构建两个方面对其进行研究。本章首先提出了复合本体的概念,并对复合本体的构建目标、构建的必要性、可行性以及复合本体与传统本体的异同进行了阐述。复合本体从计量角度和语义角度,运用计量学的方法和语义概念之间的关系,对数字文献资源进行揭示,是实现从计量和语义两个角度展开资源聚合的基础。其次,本章根据复合本体的特点和构建需求,为其构建过程选择了构建工具、描述语言,并在骨架法的基础上为复合本体设计了合适的构建思路和流程。最后,在上述工作的基础上基本完成了计量角度的构建。复合本体的基本构成要素包括类与实例、类的属性与属性值、约束条件以及推理规则。复合本体中的计量分析规则,为其逻辑推理发挥了重要作用。第三部分(第3章),研究基于复合本体的学科知识库的系统分析。本章完成了基于复合本体的学科知识库的系统分析。首先,明确了学科知识库的构建目标以及面向的目标用户,并根据要实现的目标提出了基本的构建原则。其次,对学科知识库系统的基础功能需求和服务功能需求进行了分析。最后,在功能需求分析的基础上,确定了用于满足这些功能需求所需要的知识类型,并分析了这些知识内容的基本特点。第四部分(第4章),研究基于复合本体的学科知识库的系统设计与实现。本章首先完成了知识库系统的总体框架设计,然后依次分析和解决了知识库构建中的知识表示、知识获取与知识利用这三个关键技术问题,为知识库系统的实际构建与技术实现指明了方向,奠定了基础。解决这些问题的基本思路是,先分析知识库系统的目标与库中知识特点,再据此选择合适的方法与技术,最后设计各种类型知识资源的具体表示、获取和利用模型与方案。第五部分(第5章),对基于复合本体的学科知识库构建的实证研究。本章首先根据实际情况和需求,选定了测绘学作为实验学科,并确定了实验语料库。然后通过复用现有的测绘学领域本体,完成了测绘学复合本体语义角度的构建,并通过抽取实验语料集中的数据,完成了计量角度的实例的添加工作。最后,在前文研究的基础上,完成了测绘学学科知识库的构建,并从文献检索与聚合、专家检索与聚合、主题揭示与聚合、科学计量与评价四个方面验证了其应用效果。结果证明,基于测绘学复合本体构建的测绘学学科知识库基本完成了预期的应用目标和功能,应用效果良好。本文系国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(批准号:11&ZD152)课题的组成部分和研究成果之一。