开放存取期刊的整合利用分析

来源 :硅谷 | 被引量 : 0次 | 上传用户:yr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 由于利用率不理想,迫切需要加强对开放存取期刊资源的整合利用。开放存取期刊的整合可以从与内部资源的整合和与外部资源的整合两个方面开展,在整合过程中需要进一步完善元数据标准,适度探索开展基于语义的整合。
  关键词 开放存取期刊;整合
  中图分类号:G250 文献标识码:A 文章编号:1671-7597(2013)21-0152-02
  为了缓解期刊的价格危机,提高学术资源的可利用率,开放存取期刊(Open Access Journal,简称OAJ)应运而生,得到国内外学术界的广泛支持。但大量调查研究表明,由于OAJ资源尚未很好地融入现有主流学术资源数据库,其利用率并不理想。因此,迫切需要将分散的OAJ进行整合,建立统一的资源平台,实现OAJ内部及OAJ与传统学术资源之间的无缝链接与统一检索,使用户通过传统的资源获取途径能够方面地发现和获取OAJ文献。对OAJ资源的整合可以同时从OAJ资源的内部整合和OAJ资源与外部资源的整合两个方面开展。
  1 开放存取期刊之间的整合
  要提高OAJ资源的能见度和可用性,首先必须建立OAJ资源平台,搜集整理分散式存在的OAJ资源,实现OAJ资源内部的整合。在具体实现方式上,OAJ资源的内部整合可以通过建立集中式的资源数据库和分布式查询两种方式来实现。
  集中式模式综合利用开放存档元数据收割协议(Open Archives Initiative Protocol for Metadata Harvesting,简称OAI-PMH)和网络数据抓取等方法,获取各OAJ的论文元数据,将其映射转换为符合系统要求的元数据标准,在与系统已有资源进行比对查重后将新资源存入整合平台的数据库,从而建立起集中式的OAJ资源检索和利用平台。我国教育图书进出口公司于2006年开发了OAJ一站式检索平台Socol@r,收集整理网络上的OAJ,并按照中图法进行分类,提供期刊的浏览和统一检索服务;中国科技论文在线建立了包含OAJ的在线资源基础平台;我国国家科学图书馆和国家科技图书文献中心(NSTL)也分别建立了各自的OAJ整合系统——“中国科学院科技期刊开放存取平台”和“开放存取期刊集成检索试用系统”。
  分布式模式则通过Z39.50/SRU协议,动态地将用户输入的关键词在各OAJ系统中进行检索,并将检索结果整合归并后返回给用户。在集中式模式中,平台既可以向用户提供论文的摘要等元数据信息,也可以直接提供全文。由于大多数OAJ都遵守创作共享协议(CC),允许论文被合理地转载和链接,因此集中式OAJ整合平台可以直接向用户提供全文资源。但在分布式模式下,平台提供给用户的仅是资源的元数据信息。两种类型的整合方式可以同时使用,欧洲经济学家在线(Economist Online)系统综合利用元数据收割、分布式查询等方式整合了RePEC等与经济学有关的OAJ、OAR等资源。该系统通过OAI-PMH协议和网络爬虫收割元数据,建立资源元数据库,而后以此为基础,通过OAI-PMH、Z39.50/SRU协议向其他系统提供资源获取和检索服务。
  2 开放存取期刊与外部资源的整合
  在实现资源内部整合的同时,OAJ资源还应通过融入图书馆已有资源体系、嵌入学术搜索引擎等方式,实现OAJ资源与外部资源的整合,促进OAJ资源的社会化利用,借助于用户所熟悉的信息检索工具和途径来扩大OAJ的可见度和影响力。
  2.1 融入图书馆的资源体系
  图书馆是科研人员获取学术资源的主要途径,因此应该积极将OAJ资源与图书馆已有的数据库资源进行整合,使用户能够一站式地检索各类OAJ资源和非OAJ资源。将OAJ资源与图书馆资源进行整合是一种双赢战略,一方面,OAJ需要借助于图书馆的资源平台来提高其使用率和影响力;另一方面,在期刊危机日益严峻的情况下,图书馆等信息机构也需要通过整合OAJ等外部资源来丰富自己的馆藏,拓展和提升自身的服务能力,以更好地满足用户多样化的信息需求。按照整合深度的不同,OAJ与图书馆资源的整合可以通过以下几种方式来实现。
  2.1.1 基于资源列表的逻辑整合
  基于资源列表的逻辑整合是指图书馆可以根据自身的资源建设任务和目标,有选择性地在主页上建立OAJ资源列表,对分散式存在的OAJ资源进行集中揭示,为用户提供OAJ资源导引或检索入口,实现OAJ资源和馆藏资源的逻辑整合。国内外的众多高校图书馆都已开展了相关实践,加拿大西蒙弗雷泽大学(Simon Fraser University)图书馆积极促进本校读者对OAJ的发现和利用,选择符合标准的OAJ加入馆藏期刊列表,并将维护OAJ列表的更新作为电子资源管理工作的一部分。我国大部分“211工程”高校的图书馆都通过在网页上设置“免费资源”栏目或“推荐学术站点”栏目等方式,有选择性地组织和揭示网络上的OAJ等资源。
  2.1.2 基于元数据仓储的虚拟整合
  基于数据仓储的整合是指按照事先制定好的元数据方案,通过元数据收割和网页抓取等方式获取OAJ论文元数据,经元数据映射转换为目标元数据存入仓储数据库,从而建立起集中式的OAJ论文元数据库,达到集成多个OAJ资源的目的。数据仓储方式可以控制和改善元数据质量,最大化资源的搜索发现能力。现有的大多数OAJ整合平台都是基于元数据仓储创建,EBSCO和比利时哈瑟尔特大学图书馆(Hasselt University Library)联合建立了OAJ一站式检索平台——开放科学目录(简称OSD)。OCLC与密西根大学达成合作意向,WorldCat获得通过OAIster数据库到开放存取资源的持续链接权,此举将OAIster与WorldCat的书目信息有机整合在一起,用户可以通过WorldCat的免费网站或OCLC FirstSearch直接查找和利用OAIster的资源。美国乔治华盛顿大学图书馆采用EBSCO资源发现服务(EBSCO Discovery Service,简称EDS)融合了约10所大学图书馆的OPAC、该校购买的商业数据库以及OAIster、ArchiveGrid、arXiv、牛津学术在线(Oxford Scholarship Online)和美国政府出版局目录(Government Printing Office Catalog)等开放存取资源网站,可对上述资源进行整合检索。   人力资源丰富的图书馆还可以考虑通过人工编目的方式为OAJ资源添加元数据,避免机器自动抽取过程中存在的数据兼容性差、质量不高等问题。但在此方式下,囿于成本的限制,图书馆应研究如何确定繁简适度的元数据标准,在尽量简化资源描述和满足用户对OAJ论文的基本信息需求之间寻求平衡,即要降低资源编目成本,又要兼顾用户对OAJ的查找利用。
  2.1.3 基于动态链接的整合
  建立OAJ资源的动态链接是指利用SFX/OpenURL协议为用户动态查找和生成指向OAJ资源的链接。为了适应OA运动的发展,扩充图书馆可利用的全文资源,可以在图书馆SFX链接服务器中有选择性的整合OAJ数据。由链接源按照OpenURL协议要求产生所需链接对象的上下文信息结构,传递给SFX解析器,通过SFX链接服务器对OpenURL所包含的元数据进行分析,计算出与每个链接对象相对应的URL,从而动态生成适用的链接地址,无缝集成馆藏资源和OAJ资源,实现对OAJ资源的深度整合。国内清华大学、复旦大学、武汉大学、中国科技大学等众多高校的图书馆资源检索系统均采用SFX链接工具实现了馆藏资源与DOAJ等OAJ资源平台的动态链接整合。
  2.2 融入搜索引擎
  网络环境下,由于信息内容数量的丰富性和信息格式的异构性与多样性,能满足用户一站式检索需求的搜索引擎备受欢迎,成为众多用户查找信息时的首选。根据OCLC2010年发布的《图书馆认知》报告中公布的数据,2005年有82%的美国信息消费者选择搜索引擎作为查找信息的首选工具,而到2010年这一数字上升到84%。OAJ也可以借助于搜索引擎等大众化工具来扩充资源的能见范围,促成资源的社会化利用,将资源和服务嵌入用户所熟悉与偏好的信息利用环境,借助用户熟悉的搜索工具促进对OAJ资源的发现和利用。Google等搜索引擎一直是人们查找OAJ资源的主要途径,Anna等的调查发现,科研人员主要使用ArXiv和Google获取OA论文;Swan等的调查也发现,几乎所有(98%)的作者使用目录工具查找感兴趣的文献,仅有30%的作者使用OAI搜索引擎在OA知识库中查找资源,72%的作者使用Google搜索网络上的学术文章。因此,“教育部在线精品论文”等OAJ应主动向Google、百度等搜索引擎提交论文元数据信息,同时允许网络爬虫索引其论文资源,将资源嵌入搜索引擎。
  3 需要解决的问题
  3.1 完善开放存取期刊的元数据标准
  OAJ资源整合的顺利实现离不开相应的技术标准和元数据标准,在技术标准方面,OAJ网络平台应遵循OAI-PMH等通用的互操作协议,以支持元数据的收割;在元数据标准方面,各OAJ平台应尽量采用相同或兼容性强的元数据方案,以便于资源的查重和集成。近年来,随着OA理念的更加普及和高质量OAJ资源的不断涌现,OAJ资源的标准化问题受到多个国际组织和政府机构的关注。欧盟重要的数字科研环境建设项目——D4Science项目2期工程将开发OA资源的集成和互操作技术作为重要目标。
  无论是基于元数据仓储的整合,还是基于SFX/OpenURL的动态链接整合,其基础都是资源元数据,因此选择合适的元数据类型、制定合适的元数据描述方案至关重要。在元数据类型的选择上,被普遍采用的都柏林核心元数据(Dublin Core,简称DC)标准不能很好地适用于OAJ的整合,必须使用能够包含多条元数据记录的容器来描述出版物和存储库中的目标文件,需要通过RDF描述框架集成其他元数据方案中的元素,对DC元数据进行扩展,制定能够描述期刊卷期信息和保存地址信息的元数据方案。欧洲经济学在线项目在开发资源整合平台时,就充分意识到DC元数据的上述缺陷,选择使用元数据对象描述模型(Metadata Object Description Schema,简称MODS)作为描述资源、在IR和服务提供商之间交换元数据的标准。
  3.2 逐步实现开放存取期刊的语义整合
  按照整合对象和整合深度的不同,信息资源的整合经历了以中间件技术、数字仓储技术等为代表的数据整合阶段和以建立不同信息之间的静态或动态链接为目标的信息整合阶段,正在向以揭示资源中的知识元、建立资源间的知识网络为目标的知识整合阶段发展。现有的OAJ资源整合方式还主要停留在基于元数据收割和网页抓取的数据整合阶段,以及基于SFX建立动态链接的信息整合阶段。用户搜索信息的最终目标是获取信息中的知识因子,补充和完善自身的知识结构,所以现有的资源整合应深入到知识整合层面。
  关联数据(Linked Data)的广泛应用代表了语义信息整合研究的最新发展方向,引起包括图书馆在内的多类社会主体的广泛关注。由于图书馆界的积极实践,W3C专门成立了“图书馆关联数据孵化小组”(Library Linked Data Incubator Group),帮助图书馆规划未来的合作方向,提高图书馆数据在互联网上的可重用性和互操作性能。OAJ的整合平台也可以应用关联数据,通过对论文内容进行主题标注,设定资源的属性和关系类型,建立不同主题之间的关系网络,从而实现资源间的语义关联和整合,但关联数据本质上只是语义网的基础元素,为建立资源间的语义关联提供了可能,基于关联数据的资源整合的实现还存在着术语规范、权威控制、同义词或近义词匹配合并等一系列标准问题和技术问题,需要借助于完善的领域本体、知识地图等语义工具构建资源间的知识网络,才能实现基于语义的OAJ资源的深度整合。
  项目基金
  本文为南京森林警察学院中央高校基本科研业务费专项资金项目(RWQN201334)研究成果之一。
  参考文献
  [1]OCLC提供的OAIster搜索引擎接口[EB/OL].[2013-11-13]. http://oaister.worldcat. org/.
  [2]Perceptions of Libraries, 2010: Context and Community[R/OL].[2012-03-08]. http://www.ocl c.org/reports/.
  [3]Anna Wojciechowska. Analysis of The Use of Open Archives in the Fields of Mathematics and Computer Science[J].OCLC Systems & Services: International digital library perspectives,2007,23(1):54-69.
  [4]Alma Swan, Sheridan Brown. Open Access Self-archiving: an Author Study[R/OL].[ 2013-11-13]. http://eprints.ecs.soton.ac.uk/10999/1/jisc2.pdf.
  [5]Thomas Place. Final Report on The SOA Architecture.Design[R/OL].[2013-11-13].http://www.nereus4economics.info/NEEO_finalsoa.pdf.
其他文献
上海虹桥铁路客运站大跨度柱距高铁候车厅,其消火栓布置间距超出了规范要求。通过对消火栓充实水柱的计算,并结合建筑整体的使用及美观需求,采用设计措施,从技术上解决了消火
期刊
期刊
期刊
期刊
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
期刊
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊