论文部分内容阅读
科技文献资源是支持科技发展的基础,是实现科技创新和科技可持续发展的重要保障。随着文献信息资源共建共享成为评价一个国家与地区社会经济、文化发展水平的重要标志,如何实现资源的共建共享成为目前需要解决的主要问题。作为科技文献资源主要载体的图书馆,随着数字化技术和网络化技术的发展,其馆藏的构成发生了显著的变化。目前,在图书馆中,数字资源的比例占到了很大的一部分,很多图书馆近些年大力发展数字资源,这就带来了一个问题,在资源共建共享中如何对这些不同的数字资源进行整合,为用户提供单一的检索入口,实现异构数据的统一检索呢?本文在综合分析国内外异构数据整合技术的基础上,提出了异构数据整合所存在的问题,以山西省高校图书馆异构数据整合为研究对象,分别对山西省高校图书馆馆藏数字资源进行调查,针对山西省高校图书馆目前存在的馆藏书目数据、学位论文数据、光盘数据库、多媒体数据库、自建特色数据库等异构数据,提出了基于OAI-PMH协议的异构数据整合方案。并进一步对山西省高校馆藏书目数据进行详细分析,结合本文提出的异构数据整合方案,针对山西省高校图书馆异构的书目数据库,最终建立山西省高校图书馆联合书目数据库。本文首先阐述了异构数据整合的背景和意义,就国内外异构数据整合的研究现状给予分析;然后详细分析了异构数据的涵义、异构数据的特性,并分别分析了国内外目前比较通用的几种异构数据整合技术;第三章详细研究了OAI-PMH协议,对OAI-PMH的发展和历史沿革进行了介绍,对OAI-PMH协议的互操作框架进行了详细的分析,分别对数据提供者、服务提供者、协议命令以及收割器等进行了分析;第四章首先对山西省高校图书馆的异构数据进行调查,绘出山西省高校图书馆异构数据库一览表,然后针对其提出了基于OAI-PMH协议的异构数据整合方案,分析了异构数据整合的原则,提出了山西省高校图书馆异构数据整合的互操作模型;第五章具体分析了山西省高校图书馆馆藏书目数据库的现状,对于不同的馆藏书目数据库,首先把馆藏书目数据导出,然后建立CNMARC到DC的映射表,最后通过OAI-PMH协议客户端来实现数据提供者的功能,最终实现山西省高校馆藏书目数据库的异构数据的整合;对山西省高校图书馆联合目录异构数据整合方案中发现的一些问题进行总结,希望在下一步的工作中继续研究。第六章对异构数据整合中面临的问题进行总结,同时对以后的研究进行展望。