我国机构库建设面临的几大难题及对策

来源 :经济师 | 被引量 : 0次 | 上传用户:wuyishijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:开放存取成为趋势,国外机构库发展迅速,我国发展缓慢。文章从开放存取、知识产权、资源收集等方面剖析我国机构库建设面临的困难,并给出对策。此外,分析了在新条件下,图书馆所面临的机遇和挑战。
  关键词:机构知识库 图书馆 资源收集 质量控制 IR
  中图分类号:G250.74 文献标识码:A
  文章编号:1004-4914(2009)10-013-03
  
   开放存取(Open Access,简称OA)是国际科技界、学术界、出版界、信息传播界为推动科研成果利用网络自由传播而发起的运动。近来出版机构的兼并和商业化,期刊价格大幅提高,阻碍了学术交流和科研发展。幸运的是网络技术不断成熟,web应用日益广泛,通过网络开放存取,学术成果可以无障碍地进行传播,任何研究人员可以跨越时间和空间的限制免费获取和使用学术成果。而现在图书馆讨论的热点机构库,则是图书馆界开放存取的主角。{1}
  对于机构库,迄今为止仍没有一个统一的定义。比较普遍的定义是:机构库(Intutitional Repository),是以搜集、组织、存储学术机构(大学、大学共同体等)相关数字知识资源为主要任务,并将其中绝大部分资源对任何网络用户免费开放的知识库。{2}机构库采用了开放存取的理念,机构内的智力成果进行数字保存,对资源进行全面的整合,提高资源的利用效率和社会影响力,促进学术发展和社会进步。机构库可以存在于特定的机构之内,亦可以在机构之间实现共享,甚至实现全球机构资源共享。机构库仍处在新生阶段,比较大的事件是:2000年惠普公司斥资1800万美元,与麻省理工学院(Massachusetts institution of technology, MIT)合作开发DSpace;2001年,俄亥俄州立大学的行政官员和该馆馆长布兰宁(Joseph J.Branin)在探头开发远程教育体系时,提出建立俄亥俄州立大学知识库,以保存该校师生员工的数字资源,这也成为机构库最初的雏形。{3}而2002年Dspace的正式面世,推动力机构库的蓬勃发展,许多机构使用Dspace作为平台,建立了自己的机构库。在世界范围内,机构库如雨后春笋,迅猛发展。根据著名机构库登記机构Registry of Open Access Repositories(ROAR)的统计结果显示:截至2008年9月,在此机构全球机构库已经增加至1145个。
  
  一、国内机构库发展现状
  
  国外机构库的蓬勃发展,而我国机构库发展较为迟缓。现正处于摸索探讨阶段,真正的实施应用发展还不够。比较有名的是:我国香港科技大学图书馆机构库(HKUST),{4}它于2003年2月正式启用,一次性批量收录了首批105计算机科学技术报告。到2006年9月此机构库已经收录了42个不同学术部门的2369份资料,其中包括预印本,技术报告、工作文件、会议论文、期刊文章、演讲、书籍章节、专利、论文和博士学位等,机构库中资源格式大多为PDF和PPT格式。2005年9月至2006年8月期间,这些学术资源就被检索使用了69000多次。其中一份关于香港学生怎么学英语的研究资料,更是一个月的下载次数就达到了800次。
  在国内,其它的机构库还有,例如:图书馆情报学开放文库、中国预印本服务系统、奇迹文库等。这些机构库规模都比较小,无论从资源的数量和质量上都难有保证,没有真正实现开放存取的目的。国内机构库发展,还有很长度路要走。
  
  二、国内机构库发展存在的问题及解决策略
  
  借鉴国外机构库的发展史和成功实施经验,结合我国的国情特点。机构库在我国发展缓慢是有其原因的。我国机构库的建设发展面临着以下几大难问题:对开放存取认识不足,缺乏相关政策及法律支持;资源收集范围问题;资源收集模式问题;涉及的知识产权问题;机构库资源内容质量控制问题等。以下笔者就每个问题作具体分析,并给出解决策略。
  1.对开放存取认识不足,缺乏相关政策及法律支持开放存取(Open Access 或OA)起始于20世纪90年代,是以削弱出版社的权势,恢复研究成果的公共品性质而发起的,是美国研究图书馆协会为了对抗学术信息流通危机和高价商业性学术期刊而使用的一个概念。{5}开放存取采取“作者付费出版,读者免费使用”的网络出版模式,因其具有出版成本的经济性、信息传播的时效性、获取使用的便捷性、成果扩展的广泛性等多方面的优势,得到了世界各国的广泛认同和诸多研究人员的推崇。
  与传统出版模式相比,开放存取的信息发布过程简便、时效性强,利于编辑、作者和审稿人之间的互动;开放存取迎合了科研人员对于信息即时性、复合性和多元性的需求。{6}开放存取在我国发展比较缓慢,关于开放获取的研究时间也不是很长。没有自己相应的法律体系和政策,研究也多为借鉴国外的现有成果,开放获取的理念还没有深入人心,对于科研人员和大学生而言,观念仍比较传统,对于机构知识库还相当陌生,对于开放获取了解到也甚少。出版商大多要求在获得论文印刷版版权的同时获得电子版(包括网络、光盘)版权的授权,也不允许作者将论文放于网络上,部分期刊同时声明不接收已经在网络上公开的论文来稿。由此可见,开放存取的理念在我国还没有真正深入人心。
  可喜的是我国在开放存取这条路上虽然起步较晚,但也在实践中有了初步尝试,引起了学术界的密切关注。例如,2002年“中国科学数据共享”会议上,徐冠华和孙鸿烈等院士就提出了切实改变我国传统的科学数据占有观念,打破信息壁垒,实现科学数据合理公开存取的倡议;2003 年1月,中科院文献情报中心张晓林博士参加了匈牙利举办的“开放获取与促进学术出版”国际研讨会;2004年5月,全国人大副委员长中科院院长路永祥和自然科学基金委员会主任陈宜瑜在北京分别代表各自机构签署《柏林宣言》(The Berlin Declaration),以推动全球科学家共享网络资源;在实践项目上,2004年3月15日开通的中国预印本服务系统(http :PPprep. net.gov.conPeprint) 建立以来引起了较大的影响,很多新的学术研究在上面传播,利于学术争鸣。同时具有交流速度快,可靠性较高等特点。
  这些实践都说明我国图书情报界和科研工作者在这方面进行了不懈的研究。我国要促进机构库的发展,首先必须从开放存取着手,从以下两个方向作为突破口。
  首先,机构库的发展必须注重学术信息渠道的畅通和“免费”的问题。而以图书情报界为主的信息服务机构如何利用因特网最大程度地促进信息自由,是国际图联强烈关注的内容。所以我国机构库的建设必须注重在网络环境下学术信息渠道的畅通和“免费”的实现。国内最早的导航系统是北大2000年发布的西文电子期刊导航,但检索功能、服务功能和管理功能都不够完善。鉴于我国在网络相关发展的不足,我们有必要借鉴国外的导航系统——TDNET,SERIAIS SOLUTION,EBSCOHOST EJS等,逐渐制作与完善自己的导航软件。在开放存取的道路上,必须注重在网络环境下的实现,争取早日与国际接轨。
  其次,我国应该尽早从大局上着手,从政策和法律上对开放存取提供支持。我国的信息主管部门,应统筹规划,协调图书馆界和其他相关机构,共同讨论开放存取模式在我国的实现,尽早出台相关政策,完善法律环境。
  2.资源收集范围问题。机构库的建立,必须有资源数量的保证。机构库原则上要全面收录各种有用的资源。机构库建成之后,所面临的最大挑战是内容获取。调查显示,尽管机构库采取了各种措施以鼓励机构成员参与其中,但资源提交率(Submission Rate)仍徘徊在一个较低的水平,{7}机构库的内容获取问题始终是困扰机构库发展的一大难题。机构库收录范围范围影响着机构库的发展方向及质量,在一开始,就必须重视机构库收录范围问题。
  第一,确定哪些内容需收录,哪些要摒弃。对于机构库而已,尽量做到收录全面的有用资源。但是,在实施中研究成果众多,必须加以分析本身的特色和文化,确定机构库的建设目的,明确哪些成果可予以收录, 哪些不能收录,并给出便于操作的指导性意见。学术机构的智力產出也并非只有学术研究成果,还有大量的非研究性成果, 如机构的行政文件、重要活动的纪录、课堂教学所产生的成果等等。自Raym Crow提出机构库的必要组成之一为学术内容(Scholarly Content)以来,由于学术成果开放获取的理念的广泛传播,导致学术界过分关注机构库保存和传播学术机构研究成果这项功能,而忽视了机构库作为支持机构教育、学习的功能。值得注意的是,机构库的先导——俄亥俄州立大学知识库其初衷是为了建立一个远程教育体系, 并非为实现学术机构研究成果的保存和开放获取。
  第二,谁的研究成果可以被收录。机构成员的角色形形色色,以大学为例, 其成员包括教师、专职研究人员、研究生、本科生、行政人员等。机构库并不是谁的研究成果都收录,必须保证一定的研究成果价值。机构库建设人员必须明确地给出规定,哪些人员的智力成果可以被收录。实践中,往往只有教师、专职研究员及研究生的成果才被许可。而本科生的成果、其他的一般不收录。但也有很多机构例外,如香港城市大学机构库, 规定本科生的年终项目及获奖作品也可被收录其中。{8}谁的研究成果可以被收录,主要是从研究成果质量角度考虑,所以不同机构在建设机构库的过程中,必须从自身时间情况出发,不能盲从。必要时也可以采用例外原则,保证最新最有价值的成果能在机构库中体现。
  第三,机构库收录何种类型的资源。机构库存贮的是电子资源,就必须考虑到资源的格式类型,既要能满足资源的多种需要,亦要想通用格式标准靠拢。一般而言,机构库必须支持大部分的通用格式,并能支持一定的资源容量。但在具体实践中可收录的资源多种多样,它可能包括: 预印本(Pre-prints)、后印本(Post-prints)、会议论文、教学材料、学生课程报告、学位论文、项目数据资料、计算机软件、图像、非静态的资源(如影像、声音文件)等等。机构库建设者必须从自身的时间情况和通用标准结合考虑,作出相应格式类型规定:如文本资料应选择何种格式?是microsoft word还是pdf拟或是latex?对于图像应选择何种格式?是bmp还是jpg格式等。对于资源容量的大小,考虑到现在数据存贮硬件的飞速发展和以后资源的高质量要求,尽量提供大容量空间。
  3.资源收集模式的选择。机构库的发展建设,必须要考虑资源收集模式。机构库要长期地可持续发展,必须保持机构库的更新,这就和资源收集模式选择有关。对于资源的收集,可采取的模式有三种,即分布式模式、半分布式和集中式。{9}
  分布式模式类似于自存档(Self-archiving)。特指不经过中间媒介,由资源提供者自己或者委托特定对象,进行资源的存档。
  集中式是指由机构库指定的人或组织负责资源的上传。这个限制性比较明显,只有特定的人和组织拥有存档权利,且多有机构库指定负责。
  半分布式,是介于分布式和集中式之间的一种模式,是指由机构内的各个单位分别负责协助本单位的资源提供者上传并管理研究成果。资源提供者将资源提交给本单位负责人,单位负责人集中录入资源元数据并提交资源。这种模式采取专人提交资源的方式,有利于提高办事效率, 同时有利于避免分布式模式所出现的元数据不准确的现象。
  我国在发展机构库的过程中,机构库建设者可根据机构的实际情况,适当地选择其一或选择组合模式进行资源的收集。一般而言,如果机构规模较大,宜采用分布式或半分布式;反之,则以集中式为好。机构库的成熟度也与模式的选择有着重要的关联。机构库建设初始阶段,宜采用集中式;当逐步成熟之后,可以尝试着由集中式向分布式过渡。
  4.涉及的知识产权问题。机构库发展的一个巨大挑战就是知识产权问题。开放存取本省就强调一个免费的问题。怎么样尽可能地免费,又不触犯相关法律——这就必须处理好机构库中的版权问题。不处理好这个问题,开放存取和机构库的功能及优点都无法提起。因此在发展机构库的伊始,我们就要积极协调,从政策法律问题上加以重视,并借鉴国外的相关经验和成功。
  2000年HP斥资与MIT联合开发机构库软件平台DSpace拉开了机构库建设的序幕,从此机构库得到了出版界、图书馆界、教育界等众多学者的关注。各国纷纷开展机构库的理论研究和实践,出现一些专门针对机构库的版权问题的研究项目。
  Science Commons:Scholars Copyright Project 2006年6月,科学共同体Science Commons (SC)正式启动了学者版权项目。该项目主要包括两个方面:Open Access Law Program——开放获取法律期刊原则、开放获取法律学者声明、开放获取出版协议,提供了一系列的文件来帮助法律领域出版的开放获取,从而为其他学科的开放提供向导;另一个是Science Commons Addendum——提供了三种层次的作者附录协议(author addenda):CC1.0 Addendum(署名——非商业用途)、Publish Addendum(出版之日就开放获取)和Delay Addendum(出版后6个月开放获取)。这些附录协议体现了作者对自己文章的版权争取的呼声,有利于改变出版社一统全局的现状。目前,SC正在致力于以计算机软件的形式来帮助作者自动添加这些版权协议。{1}
  RoMEO(Rights Metadata for Open archiving) 在英国的联合信息系统委员会(JISC)的资助下,该项目从2002年8月到2003年7月调查了英国学术团体自存储的版权问题。
  机构库的一个重要使命就是允许对机构库的知识资源开放存取以促进学术交流,这就需要知识资源的版权人以许可证的方式将他所希望的部分版权赋予用户。因此,机构库的建设者至少应该起草两个许可协议:一个是机构与资源提供者之间的存储许可证;另一个就是资源提供者与资源利用者之间的知识共享协议。
  首先,许可协议的制定必须尊重已有的权利,不得侵犯已有的权利。如项目研究成果等的版权本来就属于机构,作者就不能随意制定CC。开放内容许可协议必须从机构的版权政策出发,区别清不同类型的版权归属,并争取在技术应用平台上进行实现。
  其次,许可协议不能和现有法律相冲突,应该相辅相成,让法律规范向有利于机构库的方向发展。开放存取,必须以承认版权法为前提,没有法律的支持,一切都无法实现。如果没有法律规范和相应的责任承担机制,许可协议很可能会被不法分子所利用。
  我国在发展机构库的过程中必须了解到,虽然机构库的版权许可协议要依各个机构自身的版权规定而定,但目标都是一样的——促进学术交流,提高机构的影响力。一个清楚明确的版权许可协议不仅可以让资源提供者放心地将知识资源放在机构库中,而且也可以让资源的利用者毫无顾虑地利用机构库宝贵的学术资源,有效地促进学术交流和文化传播。
  5.机构库资源内容质量控制问题。机构库在建设起步的最大问题是资源的收集问题——即前面讨论的收录范围和收录模式问题。但在以后的发展过程中,更要做好质量控制保证。机构库内容的质量影响到机构库作用的发挥。对机构库内容的质量进行严格的控制, 是保证机构库得以良性发展的重要手段。
  我国在机构库的长远发展中必须从预先控制、过程控制和事后控制三方面着手,切实搞好机构库的内容质量控制。
  预先控制主要指在机构库建设者,通过发布相关规范文件,促使作者对要提交的成果进行质量控制。预先控制主要包括:对作者身份的及专业背景的限定;對权限口令的限制;对资源类型格式限制;对资源元数据格式控制;对知识产权和系统功能的解释说明等。机构库应广泛地对这些规范进行宣传,让涉及的成员都能对此有所了解。宣传的方式可以多种多样:可以在机构库主页张贴通告;亦可采取传单方式宣传。预先控制是源头控制,也是一种比较浅的控制。
  过程控制主要指在存档过程时,系统给出实时反馈信息,达到对资源内容的质量控制。这个要求机构库建设者,要全面充分考虑各种情况,并给出相应的操作提示和修改意见。过程控制主要体现在对元数据的控制,当尽量减少作者手工输入的项目,如对于国别、语言、学科分类、资源类型、格式等较规范化的项目,尽量采用从列表框中选择数据的方法。对于一些非规范化的项目,如姓名、资源中文名称、英文名称、关键词、资源描述等宜采用示例并结合字段控件等形式进行同步控制。
  事后控制主要指资源以及录入机构库以后,采取的一系列质量控制措施。事前控制主要以元数据控制为主,而事后控制主要以内容控制为主。事后控制涉及范围很广,可以是作者本人、机构库管理员,亦可以是读者。如存在攻击他人的言论、数据有重复之嫌,格式不够规范等,管理者可以对作者给出强制性或非强制性的意见。此外,机构库中资源下载统计和分析,以及读者的评论,都可以作为有效的质量控制方式。值得提出的是,由于时候控制涉及到资源的修改,所以必须慎重地进行。修改方式有覆盖和并行模式。大部分情况下,建议采取并行模式,保留历史版本和信息,且客观反映资源成果的发展变化。
  
  三、机构库给图书馆带来的机遇和挑战
  
  图书馆在学术发展、知识积累及社会发展进步中扮演着举足轻重的角色,在机构库发展的同时,必须考虑图书馆新的机遇和挑战。
  现代高新技术迅猛发展,从开放存取运动到信息共享空间再到机构库,图书馆受到了前所未有的挑战,但是我们亦到了图书馆新的发展契机。问题是如何抓住机遇,充分利用现代技术来发展自己的事业。
  1.在新的条件下,图书馆的存在仍然是必要的。随着网络的不断发展和人们获取信息习惯的变化,上网阅读很有可能成为人们学习的主要方式。但到目前为止,到馆阅读仍大于上网阅读的频率,因此图书馆仍有着网络不可取代的特异性。{10}因为图书馆通过其服务行为,能够满足读者查找资料的需要, 促进读者的娱乐、教育、科研、经济等一系列创造价值活动的形成,完善和改善,带动并影响着社会精神文明和物质文明的实现, 所以说图书馆仍将继续存在,图书馆永远是人们交流信息和经验的最佳场所。
  2.图书馆确实面临着巨大挑战。机构库发展给图书馆提出的挑战主要体现在,一方面是机构库基于开放的理念,利用各种现代信息技术以及OpenURL、OAI-PHM等一系列开放标准,在短时间内迅速形成相当规模,并朝着全球共享的知识库的方向发展;另一方面是图书馆由于各方面的原因一直在变革的问题上犹豫不决、徘徊不前,机构库的发展给图书馆在信息服务、学术交流中的地位带来了强有力的挑战,一旦图书馆不再思变革,即使调整自己的位置,体现出自身具有的优势,本已受到出版商、信息服务商冲击的图书馆很有可能面对前所未有的危机。
  3.机构库亦带来了巨大的机遇。机构库的出现和不断发展,有利于减少期刊出版商都垄断,在一定程度上遏制期刊价格上涨的势头,缓解图书馆经费短缺的压力,同时可以趁机提示图书馆的自主能力,减少对传统出版业的依赖性,拓宽图书馆的发展空间。此外,机构库中还包含大量传统期刊所没有的学术资源,图书馆如果能将机构库与传统学术体系相结合,不仅有利于扩大馆藏范围,还能促进图书馆服务水平的提高,更好为读者提供全面而优质的服务。
  4.图书馆的的应对策略。图书馆必须调整定位,寻求新的发展空间。同时,更要积极和新的技术结合,应该采取更加开放的态度,积极与网络工程师合作,利用适应互联网的先进技术及现有成果, 更好地为知识资源管理与服务提供技术及环境支撑。{11}一方面,要整合资源,义不容辞。图书馆拥有丰富的信息资源无疑是网络中的宝贵资源,但无需的信息只会让用户淹没在信息的海洋中而无法找到所需信息,机构库的出现让图书馆认识到整合信息资源的重要意义,同时图书馆经费短缺压力大减少,使得图书馆有更多的人力、财力、物力进行资源的整合,为图书馆提高信息水平奠定基础。另一方面,要积极参与机构库的建设,实现互助互赢。当前,图书馆在数字图书馆的研究和实践中,有很多思路和机构库不谋而合。因此,图书馆应积极参与IR的建设,利用其在信息组织、信息标引等方面的专业优势及数字图书馆建设中的经验教训,参与IR的建设,还可以学到最新的信息技术,全新的信息服务模式,促进图书馆的创新,提高整体服务水平。
  
  四、结束语
  
  正如联想集团CEO张后启先生所说, 一个知识库和一个垃圾库之间只有一步之遥。我国机构库在建设中数量固然重要,但更要注意质量的保证。在构建中,必须处理好上述提及的种种问题。这样保质保量的机构库,才能起到它应有的作用。事物发展道路是曲折的,前途是光明的。我国在公开存取新技术上已经落后了国外一大段,所以我们更要借鉴国外的成功经验,踏踏实实,逐步解决遇到的问题。图书馆在其中扮演着重要角色,图书馆要正视机遇和挑战,调整定位,主动配合,积极参与,为我国机构库的建设作出应有贡献。
  
  注释:
  {1}张俊玲.机构知识库建设中存在的问题及对策[J].湖湘论坛, 2007(3):60—61
  {2}董文鸳,袁顺波.聚焦学术机构知识的中心:机构库(Institutional Repository)探析.图书馆杂志,2005,24(8),51-55,59
  {3}Sally A.Rogers.Developing an Institutional Knowledge Bank at Ohio State University:From Concept to Action Plan.Libraries and Academy,2003,3(1):125-136
  {4}Ki-Tat Lam,Diana L.H.Chan.Building an institutionalrepository:sharing experiences at the HKUST Library.OCLC Systems&Services Vol.23 No.3,2007,pp.310-323
  {5}乔冬梅.国外学术交流开放存取发展综述[J].图书情报工作,2004 (11)
  {6}查丽华.开放存取——开启学术信息交流的快捷之门[J].国家图书馆学刊,2007(1)
  {7}Leslie Chan.Supporting and enhancing scholarship in thedigital age:The role of open-access institutional repositories[EB/OL].http://eprints.rclis.org/archive/00002590/01/Chan_CJC_IR.p df,2006-05-20
  {8}Run run shaw library.About CityU institutional repository[EB/OL].http://www.cityu.edu.hk/lib/digital/ir/about.htm,2006-05-12
  {9}郭少友.机构库建设的若干问题研究.中国图书馆学报,2006(1)
  {10}张静琳.Google还是图书馆.21世纪经济报道[EB/OL].[2006210216].http://media.esms.com.cnP21sjjjP309yuandan/Content/dir/sy
  2101htm
  {11}吴建中.图书馆VS机构库——图书馆发展战略的再思考[J].中国图书馆学报,2004(5):528
  (作者为上海大学国际工商学院情报学研究生 上海 200444)
  (责编:若佳)
其他文献
文章从餐饮经营的五大要素入手,分析宾馆餐饮与社会化餐馆的成败得失,大胆提出了宾馆餐饮走社会化餐馆经营模式的新思路,力求探索一条适合宾馆餐饮发展的新路子。
在危机面前,党和政府以财政政策和货币政策等宏观调控手段努力为中国企业创造条件,从这个角度看,金融危机已经成为中国企业加速结构调整的一个机遇。不能仅依靠政府,中国企业应该
企业是生命体,犹如一棵树.企业从小到大,不断发展壮大,经过几年、几十年的努力,成为"百年老店",成为跨国公司;就像一棵树从幼芽到大树,不断地吸收阳光雨露、吸收土壤中的水分
文章分析了戚家桥泄水闸存在的问题,对拆除重建工程方案进行了技术经济比较,指出了水闸工程设计的关键点。
腾保数据公司揭开全球最小的机架式LTO自动加载机,采用1U架构.拥有LTO2的容量及表现.可提升数据存储管理功能,革命性的1U架构LTO StorageLoader自动化解决方案,采用腾保最新公布的
期刊
由于资本市场的迅速发展,我国上市公司重大资产重组办法也不断健全。现选取神州数码股份有限公司,通过对其并购重组过程和结果的介绍,从证监会给出的被否原因和对其财务分析
近日,洛阳市应急指挥平台的项目招标尘埃落定,RADVISION公司的SCOPIA平台继中标河南省应急指挥平台项目后,再次夺标。相关负责人表示,之所以选择RADVISION,主要是看中其在统一通信
珠海欧比特控制工程股份有限公司目前宣布,正式加入中国嵌人式系统产业联盟(简称中嵌联盟)并获得其颁发的中国嵌人式系统产业联盟主任单位证书。伴随着国内嵌入式行业的快速发展
全球互联网正在高速发展,我国也不例外.当前,全球的移动电话用户数已超过15亿,互联网用户数超过了7亿.