论文部分内容阅读
知识的获取、交流、保存和传播是科研和创新活动持续开展的基础。随着开放获取运动的兴起,越来越多的知识内容以支持开放获取的方式被创建、发布和传播利用。开放知识库作为开放获取实践的主要形式和途径,为大量涌现的开放知识的管理提供了必要的手段、方法和工具支持,已经成为构建和发展开放知识环境基础设施的必要组成部分。开放知识库网络作为一种联合型态的开放知识库,也正在成为从研究团体、学科或区域等更大范围内发展和构建开放性知识合作网络的基本形式。科学知识的开放获取和当前学术交流模式正在发生的变化甚至变革,是推动开放知识库及开放知识库网络发展的主要动因,因应这种形势,科研机构、科学团体以及国家层面开始重视和加强自身知识战略目标的规划与实施,则是驱动开放知识库及开放知识库网络涌现和发展的实质力量。
本文通过对开放机构知识库网络产生的背景进行分析,对国内外开放机构知识库网络研究与实践现状、进展进行调研分析的基础上,指出了当前开放机构知识库网络构建过程中存在的主要问题,并从中形成了本文研究的主要问题和目标。针对这些问题,论文开展了如下方面的研究:
首先,对开放机构知识库网络的构建模式包括共享系统模式、分布式聚合模式和分布式检索模式等进行了分析和比较研究,认为分布式聚合模式将是未来构建机构知识库网络的主要模式和方向。在此基础上,对基于分布式聚合模式构建开放知识库网络的关键技术和方法包括OAI-PMH元数据开放获取协议、METS元数据编码与传输格式、OAI-ORE对象重用与交换规范、分布式检索互操作协议SRU及OpenSearch规范、简单Web服务仓储存交协议SWORD等的基本模型和过程进行了分析研究。
接下来以中国科学院机构知识库网络为例,提出了一种构建机构知识库网络的整体性框架和递进发展模式,即将机构知识库及其集成服务网络作为一个整体来进行系统地规划和设计,并采取从试点示范、到规模扩展、再到广泛覆盖的渐进发展策略和模式,形成在一个组织范围内构建和发展机构知识库网络的有效实践模式和最佳方法。同时,提出了一种支持多层次开放互操作标准的开放机构知识库网络框架,并对框架实现的关键技术和标准进行了分析阐述。
随后,论文进行了开放机构知识库网络的实现研究。以CAS IR系统的设计和实现为例,通过应用基于开源软件的快速原型方法和其他方法的结合,形成了CAS IR系统构建的需求框架,并以此为基础提出了CAS IR系统的功能框架设计。对功能框架所涉及的元数据框架、内容采集框架、用户服务、统计利用、开放互操作接口等进行了分析和设计,并重点和提出了CAS IR支持内容采集的综合化方法和机制,支持以开放互操作的方式和优化的流程形成内容采集建设的多渠道可靠保障机制。同时,对利用CAS IR系统构建开放机构知识库网络集成门户系统的实现过程进行了分析。
最后,对开放机构知识库系统及集成门户系统的实际应用情况进行了概述,包括研究所IR的部署及应用,以及IR网络集成门户系统的数据聚合与试验等。
总体上,论文对构建开放机构知识库网络的技术模式和关键技术进行了研究和实证应用,研究形成的构建机构知识库网络的整体性框架和过程模式、多协议开放互操作框架、多渠道知识内容采集框架,对于开放机构知识库网络的构建和发展,特别是我国机构知识库网络的构建和发展,有重要的理论参考意义和实践价值。