数字资源长期保存开源软件比较研究*

来源 :新世纪图书馆 | 被引量 : 0次 | 上传用户:liongliong574
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 论文介绍了8种数字资源长期保存开源软件:Invenio、DSpace、Eprints、Fedora、Drupal、i-Tor、MyCoRe和OPUS,阐述了它们的产生和发展过程,并从软件概况、技术规范、知识库及系统管理、系统性能及系统维护5个方面进行了比较分析,概括了这些软件的共同点和不同点,希望能够为各机构选择长期保存软件提供参考,并为国内从事数字图书馆系统设计和开发的同行提供参考。
  关键词 数字资源长期保存 开源软件 数字图书馆 技术规范 知识库
  分类号 G250.76
  Comparison Research of Several Digital Preservation Open Source Software
  Ma Ningning, Zhou Chen, Feng Hongjuan
  Abstract This paper introduces 8 kinds of digital preservation open source software: Invenio, DSpace, Eprints, Fedora, Drupal, i-Tor, MyCoRe as well as OPUS, describes the emergence and development of them, carries out a comparison and analysis from 5 aspects: software overview, technical specifications, repository and system management, system performance, and system maintenance, summarizes the similarities and differences of these software, hoping to provide a reference for organizations to choose the best digital preservation software, and provide some help to the designer or developer of digital library software system in China.
  Keywords Digital preservation. Open Source Software. Digital library. Technical specification. Repository.
  0 引言
  数字资源长期保存的概念自20世纪80年代提出以来,国内外一直在进行着大量的研究,并且涌现出一大批功能完善、各具特色的数字资源长期保存开源系统或软件,深得各国图书馆的青睐。构建数字资源长期保存系统的开源软件发展极为迅速,截止到目前,已有Archimede,ARNO,Invenio,DSpace,Eprints,Fedora,Drupal,I-Tor,MyCoRe和OPUS等10 余种。本文重点介绍8种比较有代表性的数字资源长期保存开源软件,并从数字图书馆内容管理系统应具备的主要功能(资源的批量导入与导出、存档管理及系统维护、用户查询与浏览、访问控制)的角度,对这8个系统进行了详细的比较和分析。
  1 系统功能和服务特性概览
  1.1 DSpace
  DSpace由美国麻省理工大学图书馆和惠普公司实验室联合开发,第一个版本于2002年12月发布,是一个收集、组织、存储、索引、发布任何格式和层次结构的数字对象的内容管理发布系统。DSpace遵循BSD协议,采用DC(Dublin Core)元数据来描述数字对象,支持OAI-PMH2.0协议,可以导出METS格式的数字对象,通过METS与其他系统交换资源。DSpace系统结构分为三层:应用层、事务逻辑层和存储层。应用层包含DSpace的用户应用界面、数据提供导入导出工具、统计工具等功能;事务逻辑层负责存档文件、电子用户、授权及工作流等内容的管理;存储层负责元数据及内容的物理存储,如PostgreSQL、Oracle数据库的访问管理、文件系统管理、维护内容索引等[1]。
  DSpace可扩展性强、功能集成、界面友好,而且使用的第三方软件也均为开源软件,如PostgreSQL,JDK,Apache等,因而受到很多高校和研究机构的青睐。当然,DSpace也有不足之处,在实际应用中需要对其进行本土化处理,如:汉化系统的用户界面、邮件内容、提交作品的描述信息等内容,需根据实际情况设置系统的主题、提交策略和服务条款,从而对系统进行相应的优化改进。
  1.2 Fedora
  Fedora(Flexible Extensible Digital Object and Repository Architecture)系统始于1997年,在Andrew W. Mellon基金会的资助下,由弗吉尼亚大学和康奈尔大学联合开发,2001年发布其第一个版本。Fedora遵循Mozilla许可协议,采用CORBA和Java技术实现,是一个通用的数字对象管理和存储系统。Fedora系统由数字对象和仓储框架两大实体组成,数字对象是Fedora体系结构的核心,提供了一个集成内容(包括数据和元数据)和行为(对内容的操作)的框架;Fedora仓储是为数字对象服务的,提供了对数字对象的存储管理和访问接口,客户端通过管理和访问接口跟仓储进行交互。Fedora的体系结构分为web 服务层、逻辑应用层和存储层三层[2]。
  Fedora系统中的数字对象使用METS标准编码,以XML格式存储,方便了数据导入导出时的信息交换。Fedora实现了数字对象框架,扩展性强,适合存储和管理各种属性不同的复合数字对象;支持OAI协议,可以很方便地进行互操作,美国塔夫斯大学、维吉尼亚大学、英国赫尔大学等机构都是其忠实用户。但由于Fedora仅提供管理和访问数字对象的接口,没有用户界面,因此在实际应用中需要使用者进行二次开发,通过编码来调用这些接口,使用门槛较高。   表3 内容导入/导出比较
  2.4 系统性能
  系统性能分可扩展性、易用性、模块化三部分进行了比较。可扩展性好的软件将为具有研发实力的机构使用系统提供更大的空间,可满足更多的需求;易用性决定着开源软件使用的技术“门槛”的高低;模块化的设计将有助于开源软件的爱好者和志愿者在软件后期可以自由操作功能模块。比较结果可见表4。
  表4 系统性能比较
  2.5 系统维护
  开源软件的后期开发依靠的是广大的社区程序志愿者,虽然存在一定的组织,但都是松散的非商业化组织,所以在选择开源软件时还是需要选择系统维护策略相对完善的软件。对于是否有系统维护,详见表5。
  表5 系统维护比较
  2.6 小结
  通过上文的比较和分析,可以看出这些软件都具有比较好的开放性、通用性和可扩展性。主要表现在:(1)这8个软件均遵循开放源代码许可协议,可以免费获取,并可自由修改、升级和重组;(2)均可以在时下主流的操作系统(如Linux/ Unix/ Solaris)上运行;(3)均支持OAI(Open Archives Initiative,开放文档计划)元数据收割协议,使每个用户都能加入全球互操作研究知识库的网络;(4)均支持国际上通用的底层数据库(如MySQL/PostgreSQL);(5)可以接受所有的文档格式;(6)可以批量导入元数据和对象数据,批量导出的数据和内容均具有可移植性;(7)均使用了模块化的设计理念;(8)均可以自动安装和更新脚本;(9)针对分布式环境下的数字资源设计了元数据管理方案,大都采用了国际上通用的元数据标准(如DC),并可以根据需求自主增删元数据字段,8个软件均可通过系统为存档资源分配标识符;(10)均提供系统使用的帮助文档或手册,并且大多数软件均提供对存档资源的检索和浏览功能。
  从上面几个表格的比较中,我们还可以看出:(1)Dspace目前在全球的用户数目最多,其次是Eprints、Fedora、Drupal和OPUS,这5个软件占据了全球90%以上的用户;(2)Drupal和I-Tor在用户服务方面的功能最为完善,不但可以定制界面、提供系统讨论平台、支持全文检索,还提供丰富的资源检索和浏览功能;(3)Dspace、Fedora和Invenio不但制定了数字资源的长期保存策略,还支持元数据的长期保存;(4)Fedora、Drupal、MyCoRe和I-Tor提供了丰富的API接口,扩展容易,而Dspace、EPrints、Invenio和OPUS系统本身的功能就比较完善,密封性强,扩展难度相对较大;(5)Fedora和MyCoRe这两个软件不提供面向终端用户的数据操作和访问界面,不是一个完整的、可立即使用的仓储软件,均需要进行二次开发,对使用机构的研发能力有较高的要求,而其它6个软件的系统功能则比较完备,容易使用。
  3 结语
  本文介绍的8种数字资源长期保存开源软件没有绝对的优劣之分,它们在创建之初都是根据特定的运行环境和功能要求、按照一定的原则和目的来设计开发的,侧重点和优势也各不相同。这些软件各具特色,各有所长:Invenio能够处理包含不同类型资源的中等规模仓储;DSpace支持基于社区的内容政策和提交程序,并提供工具来长期保存提交的数字对象;Eprints提供了一个简单、有用的仓储系统,安装了一个庞大而活跃的用户社区;Fedora提供了一个功能全面的数字图书馆系统,是容纳非常庞大的资源库;I-Tor提供的工具包是构建一个访问并集成显示多种数据库内容的统一环境;MyCoRe强调灵活性,以及配置软件以支持完全不同的数字图书馆和仓储数据库的能力;OPUS则提供了一个庞大而多样的德国用户群。
  总之,这8种软件各具特色又有丰富的功能,可满足大多图书馆保存和管理其数字资源的需求。各机构可根据自身的实际需求,选择最适合的软件作为其应用或开发平台。本文通过对这8种软件进行详细比较,希望能为国内从事数字资源长期保存系统设计与开发的同行提供参考,也为机构团体选用长期保存开源软件提供借鉴。
  参考文献:
  [ 1 ] DSpace website[EB/OL].[2013-10-03].http://www.dspace.org/.
  [ 2 ] Fedora website[EB/OL].[2013-10-03].http://www.fedora-commons.org/about.
  [ 3 ] EPrints website[EB/OL].[2013-10-15].http://www.EPrints.org/.
  [ 4 ] Drupal Groups[EB/OL].[2013-10-15].http://groups.drupal.org/libraries.
  [ 5 ] Invenio website[EB/OL].[2013-11-06].http://invenio-software.org/.
  [ 6 ] i-Tor.[EB/OL].[2013-01-06].http://sourceforge.net/pr
  ojects/i-tor/.
  [ 7 ] MyCoRe website[EB/OL].[2013-11-08].http://www.mycore.de/about.html.
  [ 8 ] About OPUS[EB/OL].[2013-11-12].http://elib.uni-stuttgart.de/opus/doku/about.php?la=en.
  [ 9 ] Invenio website[EB/OL].[2013-11-15].http://invenio-software.org/wiki/WikiStart?action=history.   [10] sourceforge[EB/OL].[2013-11-25].http://sourceforge.net/projects/i-tor/?source=directory.
  [11] MyCoRe website[EB/OL].[2014-01-25].http://www.mycore.de/archive.html.
  [12] DuraSpace website[EB/OL].[2014-02-05].http://duraspace.org/about_dspace.
  [13] Fedora Commons Registry[EB/OL].[2013-02-15]. https://docs.google.com/spreadsheet/ccc?key=0AnXL
  MjeiSH_KdElwYi11dGhQTURMZmR1eEdXbDFZMH
  c&hl=en_US#gid=0.
  [14] Drupal Groups[EB/OL].[2014-02-15].http://groups.drupal.org/libraries/libraries#consortia.
  [15] sourceforge[EB/OL].[2014-02-22].http://sourceforge.net/projects/fedora-commons/files/fedora/.
  [16] sourceforge [EB/OL].[2014-02-27].http://sourceforge.
  net/projects/mycore/.
  [17] MyCoRe website [EB/OL]. [2014-01-05].http://sour
  ceforge.net/projects/dspace/files/?source=navbar.
  [18] EPrints 3.3.11[EB/OL].[2013-12-03].http://files.eprints.org/827/.
  [19] Drupal website[EB/OL].http://drupal.org/,[2013-12-17].
  [20] Invenio website [EB/OL]. [2014-03-23].http://invenio
  -software.org/wiki/Installation/Download
  [21] MyCoRe website[EB/OL].[2014-03-29].http://www.mycore.de/download/index.html.
  [22] OPUS Software[EB/OL].[2014-04-11].http://elib.uni-stuttgart.de/opus/doku/opus_sw.php.
  马宁宁 国家图书馆馆员。北京,100081。
  周 晨 国家图书馆副研究馆员。北京,100081。
  冯红娟 国家图书馆馆员。北京,100081。
  (收稿日期:2014-04-17 编校:方 玮)
其他文献
1991年2月~1994年6月,我们对654例肝炎患者进行抗-HAV-IgM、HBV-M、抗-HEV、抗-HCV血清学检测,结果报告如下: 材料与方法 本组男496例,女158例,年龄3~75岁,诊断标准及临床分型
<正> 随着分子生物学研究的进展,已发现前C/C区基因突变与e系统及慢性肝病恶化有一定关系。现对我院52例慢性重症型乙型肝炎(慢重肝)患者的血清学检测结果进行分析,报告如下:
论文通过网络调查的方式,对国内外40所知名图书馆的咨询服务现状进行调查,并通过若干典型案例得出了一些改进图书馆咨询服务工作的启示:图书馆应拓展咨询服务方式,积极利用社交网
由全国地理教学研究会、课程教材研究所和福建师大地理系联合召开的首届中青年地理教育理论研讨会于1992年12fl6日-10日在福建师大举行。这是全国地理教学研究会成立以来第一
中药复肝33号方治疗慢性乙型肝炎161例,设同期对照,结果提示本方对改善肝功能、抑制病毒复制均有肯定疗效。与对照组相比差异显著.经随访80%病例疗效巩固,说明本方有较好的重
本文描述英语中的妇女歧视现象及其产生的社会根源,申明只有解决社会上存在的性别歧视问题,提高妇女的社会地位,才能最终消除语言上的性别歧视现象.
对40例老年单纯性戊型肝炎与同期住院的非老年单纯性戊型肝炎患者进行对比分析,发现老年组与非老年组临床症状相似,两组SB、ALT达高峰值的时间一致,P】0.05。但老年组较非老