论文部分内容阅读
摘 要 科研数据服务是图书馆、科研机构为科研工作者顺利开展科研活动提供的一项服务。目前,科研数据服务已广受关注,国外高校更是形成了成熟的科研数据服务体系。论文以伊利诺伊大学香槟分校图书馆的科研数据服务为研究案例,总结其科研数据服务的内容及特点,为我国图书馆科研数据服务提供建议。
关键词 科研数据服务 数据管理 伊利诺伊大学香槟分校图书馆
分类号 G252.6
DOI 10.16810/j.cnki.1672-514X.2017.05.×××
Abstract Research data service is provided by libraries and research establishments to researchers for the purpose of promoting research activities. At present, research data services have been attracted widespread attention, and foreign universities have formed the mature system of research data service. This paper takes the research data service of the University of Illinois at Urbana-Champaign Library as the research case, and summarizes the contents and characteristics of its research data service, so as to provides suggestions for the research data service of the libraries in our country.
Keywords Research data services. Data management. University of Illinois at Urbana-Champaign Library.
0 引言
科研数据是人类在进行科学研究的整个过程中产生、加工的数据、数据产品及其相关信息[1],是科学研究的产物。从范围来看,科研数据不仅包括自然科学的数据,也包括考古学、文学、历史学、政治学等各学科领域的数据;从内容来看,包括原始数据及其相关的元数据等信息[2]。依据数据来源可将科研数据分为观测数据observational data、实验数据experimental data、仿真数据simulation data、派生数据或编译数据derived or compiled data和参考数据或规范数据reference or canonical data五种类型[3]。科研数据管理是以科研数据为管理对象的一项工作,以数据生命周期为基础,即科研数据管理以创建数据、处理数据、分析数据、长期保存数据、获取数据、重用数据这六个阶段为基础[4]。科研数据服务是图书馆、科研机构面向科研工作者提供的,主要包括科研数据管理规划服务、数据描述和存档服务、科研数据管理教育培训服务、关联环境性服务等[5]。
目前,科研数据服务受到业界广泛重视,催生了一系列专业从事数据管理的组织机构,如1957年成立的世界数据中心(World Data Center,简称WDC)、1966年成立的国际科技数据委员会(Committee on Data for Science and Technology,简称CODATA)[6]、1947年美国建立的数据档案管理部门——罗普中心(Roper Center)等,截至2013年国际上注册的国家级社会科学数据管理机构会员已达35个[7]。同时,国外高校图书馆也纷纷开展科研数据服务,如麻省理工学院、哈佛大学、约翰霍普金斯大学、加州大学洛杉矶分校、伯克利分校、伊利诺伊大学、康纳尔大学、牛津大学、剑桥大学、坦佩雷大学、莫纳什大学、奥克兰大学等。而作为“美国公立大学三巨头”、2016年《美国新闻与世界报道》世界排名第43位[8]的伊利诺伊大学(University of Illinois,简称UI)更是对科研数据服务极为重视,不仅开展数据管理教育认证项目(Data Curation Education Program,简称DCEP)[9],而且该校图书馆提供完整的科研数据服务且该科研数据服务体系已较为成熟,成为各高校图书馆科研数据服务的楷模,其中以伊利诺伊大学厄巴纳—香槟分校图书馆的科研数据服务为最。
1 伊利诺伊大学香槟分校图书馆科研数据服务内容
伊利诺伊大学香槟分校图书馆的科研数据服务(Research Data Services,简称RDS)依据數据生命周期,主要从数据管理、数据组织、数据存储和备份三个方面进行科研数据服务,为伊利诺伊大学所有研究者提供专业知识、专业工具和基础设施,从而起到管理和组织科研数据、促进科研活动顺利进行的作用。
伊利诺伊大学香槟分校图书馆提供的主要资源服务包括:(1)科研数据管理和共享的平台;(2)促使科研数据组织、处理、传输且符合要求的技术;(3)保存和分享科研数据的校园基础设施[10]。同时提供数据管理教育和相关认证,定期发布科研数据服务报告,例如2016年1月30日发布的《管理科研数据》报告[11]、2015年伊利诺伊大学香槟分校的科研数据管理服务报告等[12]。该校科研数据服务与美国国家图书馆总部、美国国家超级计算机应用中心、校图书馆、校图书情报研究生院等联合主办,汇集科研数据管理、数据综合处理及各学科领域专家,形成包含科研数据管理计划、科研数据组织、科研数据保存与共享、科研数据管理培训四部分的科研数据服务体系。 1.1 科研数据管理计划
科研数据管理计划即在科学研究开始之初,制定对科研过程中所产生、使用的数据进行管理的计划,是科研数据管理的总纲。美国国家科学基金会(National Science Foundation,简称NSF)要求从2011年开始资助的科研项目均要有数据管理计划(Data Management Plan,简称DMP),且很多科研基金机构对于DMP的结构、包含的内容等要求各有不同,NSF更是对不同学科领域的DMP提出了不同的要求。因此,伊利诺伊大学香槟分校图书馆科研数据服务组为科研工作者提供详尽的各机构的科研数据管理计划要求,并提供相应的咨询指导服务,以促使科研工作者顺利完成科研数据管理计划。
伊利诺伊大学香槟分校图书馆科研数据服务组总结出科研数据管理计划应具备数据存储、数据命名、数据共享、科研活动时间分配、科研活动的人员分配、数据的参考资料和政策、成果的归属于权利等内容。同时在制定科研数据管理计划时要注意以下五点:
(1)科研数据管理计划要预测科研活动中使用的软件和被存储的数据类型。例如:一些工具需要特殊或合适的软件,而一些项目需要大量的数据(包括文件的数量和大小),要事先计划这些事务,在管理计划中加以说明和处理,促使科研数据管理过程中不受干扰。
(2)要计划好创造或采用的标准术语和命名规则。例如:创造了一套个人使用的命名规则后就一直使用,或采用通用的标准化术语和命名规则,此举利于数据管理、查找和存储。
(3)制定好科研活动时间表,详述科研数据管理过程中每一时期的工作,划定时间期限。
(4)分配好科研活动中参与人员的责任。例如:安排专员进行数据备份,或安排专员进行数据搜集等,将每项科研活动具体到个人身上。
(5)要考虑好数据长期保存、数据的分享、数据的归属和权利等问题[13]。同时,伊利诺伊大学香槟分校图书馆科研数据服务组汇总了主要科研机构科研数据管理计划要求(详见表1、表2),并以此要求为基准为科研工作者提供科研数据管理计划模板和指导。
伊利诺伊大学香槟分校图书馆科研数据服务组提供制定科研数据管理计划使用的工具是DMP Tool工具,它可以为特定的研究项目和资助机构创建一份准备使用的科研数据管理计划,提供一份科研数据管理计划的模板,方便科研工作者制定管理计划。它是由美国加利福尼亚大学信息中心的数字图书馆( California Digital Library) 开发的,提供多种符合科研资助机构数据政策要求的科研数据管理计划模板,用户可根据需要创建。主要服务有三项:(1)帮助用户创建和维护不同版本的数据管理计划,并根据要求输出不同格式的数据管理计划;(2)为科研工作者提供各个机构的数据管理问题及如何满足基金的要求的指南;(3)為科研工作者提供数据管理计划的培训及咨询[15]。DMP Tool 工具创建的科研数据管理计划主要有四个部分:概述计划总体情况、详述计划细节、设置计划权限、导出计划。用户在使用DMP Tool时只需选择伊利诺伊大学香槟分校登录在校账户即可进入创建管理计划,选择对应的基金机构数据管理计划要求的模板,根据提示回答问题,在模板上编辑管理计划即可完成[16]。综上,伊利诺伊大学香槟分校图书馆的科研数据管理计划提供科研数据管理计划制定指南、科研数据管理计划要素、模板、工具以及科研数据管理计划的咨询服务和教育培训。
1.2 科研数据的组织
目前,图书馆对科研数据的组织按其存储地点分为两种:机构仓储方式组织数据,即对存储在图书馆或机构内的数据进行组织;数据门户方式组织数据,即对存储在图书馆外的数据进行组织[17]。其中机构仓储组织数据,就是将科研工作者在科研活动中的数据保存在该机构的机构仓储内,并进行数据组织,从而保存机构成员的研究成果,为其提供出版机会。在机构仓储中组织数据更快速、及时,有利于降低数字过时的风险,促进未来研究的可持续性,同时,机构成员可通过机构仓储实时上传数据,扩大数据影响范围,降低数据共享成本。而对于存储在机构外的科研数据,则通过建立科研数据门户网站的方式进行数据组织。此举通过网页链接到其他存储中心,将科研数据、与科研数据相关的资料汇集,建立起符合研究环境的科研数据组织体系,使科研数据在统一的环境下进行组织,保证科研数据组织的一致性、便捷性,利于长期保存[17]。
伊利诺伊大学香槟分校图书馆科研数据服务组提供机构仓储组织数据和数据门户方式组织数据两种方法。在机构仓储组织数据方面,建立了IDEALS数据库进行组织。IDEALS库收集了伊利诺伊大学所有科研工作者的科研数据,在此数据库中科研工作者可管理、上传、组织自己的科研数据,也可了解他人的科研成果[18]。而在数据门户方式组织数据上,伊利诺伊大学则建立了学术共享圈(The Scholarly Commons)用于支持科研工作者发现、获取、使用和管理科研数据,该网页设有著作权、数据发现、数据支持、电子数据智能化等服务导航,也提供相应的软件下载导航等[19]。最后,伊利诺伊大学香槟分校图书馆科研数据服务组提供科研数据组织指南、强调科研数据组织要素并提供科研数据组织的咨询及培训。例如:提供的科研数据组织指南中强调对科研数据进行组织时,要首先考虑对数据的命名,使用系统的、一致的命名准则,尽量避免使用特殊字符和空格(用下划线代替),不使用文件名去描述文件,在命名过程中考虑项目名称/缩写、实验/仪器的类型、信息的位置、研究者姓名的首字母、日期、版本号等。伊利诺伊大学香槟分校图书馆科研数据服务组也强调科研数据组织的要素,如要做好版本跟踪,要一直保存一份从未复制过的原始数据,或长期保存一份纯文本格式数据,只在原始文件的复制件上进行分析、排序、细化、或进行其他操作,同时也要对元数据进行描述,要注意元数据题目、数据类型、发布者、时间等要素,以确保搜集到的资料不会丢失,为数据提供一段重要信息的描述[20]。 1.3 科研数据保存与共享
科研数据的保存是日后的科研利用的基础,是科研活动的顺利进行的必要保证,因此,在科研数据服务中科研数据的保存极为重要。科研数据的保存要注意提高科研数据使用的持久性、完善科研数据的可访问性,确保科研数据的真实、完整。科研数据保存包括七个环节:(1)科研数据保存前的准备工作,包括要确定所保存的科研数据的类型、对科研数据进行注册、对科研数据进行描述,其中要确保科研数据保存的类型一致,对科研数据进行描述时要遵守元数据标准,将科研数据标准化;(2)规定科研数据保存的年限,在确定各个科研数据集的保存年限前,要将科研数据进行分类,对不同类型的科研数据集进行保存年限的规定,要使用同一套分类标准划分科研数据,并使用统一标准保存科研数据集;(3)规定科研数据的保存位置,要对数字型科研数据和非数字型科研数据的保存位置进行区分规定,保证保存位置的可访问性;(4)规定科研数据保存位置变更的细节,要详细记录科研数据保存位置变更的整个过程,及时更新科研数据保存位置变更的信息;(5)规定科研数据的保存格式,要统一科研数据的保存格式,进行标准化,同时使用开放性的保存格式,保证数据在转换过程中不丢失;(6)规定超出保存期限的科研数据的销毁工作,对不同类型的科研数据采用不同的销毁方法,同时确保科研数据销毁后的不可逆性;(7)规定科研数据的备份,对科研活动前、中、后不同时期的科研数据进行及时备份,并确保备份的安全性[21]。
科研数据的共享是科研工作者进行交流学习的保障,建立在良好的科研数据保存的基础上的科研数据共享,能更好地促进科研工作者之间的交流。因此,科研数据共享不仅是科研数据管理的重要内容,更是科研数据服务的重中之重。科研工作者在进行科研数据共享时,要规定好版权和许可,确定获取权限,制定共享协议,确定共享方式,也要做好保密机制与开放共享机制的结合,既要保证科研数据的广泛交流,也要做好科研数据中重要数据的保密[22]。
伊利诺伊大学香槟分校图书馆科研数据服务组提供大容量数据的存储,例如:伊利诺伊的IDEALS库(免费)和Data Dryad库(收费);在数据共享中提供科研数据安全管理措施,成立专门机构——伊利诺伊隐私和信息保障办公室(Illinois’ Office of Privacy and Information Assurance,简称OPIA)保障数据存储、共享的安全,其主要工作是对敏感数据提供数据分类指导和培训,同时该机构还联合该校机构审查委员会(Institution Review Board,简称IRB)、美国国家超级计算机应用中心(National Center for Supercomputer Application,简称NCSA)共同研究如何安全地存储大量的敏感数据,为科研数据提供永久保存和长期访问。同时该校科研数据服务组也对科研数据的保存与共享提供指导说明、培训、咨询,例如:服务组强调要做好科研数据的备份,至少保存三份存储位置不同的文件;做好重要数据的长期访问归档等,并定期开展以科研数据保存与共享为主題的培训[23]。
1.4 科研数据管理培训
根据调查国外高校图书馆的科研数据管理培训主要有三种形式:专题研讨会∕班、培训课、在线教育[24]。“专题研讨会∕班”的形式较为自由,参与者可相互交流心得,“培训课”则能较为系统地学习科研数据管理的相关知识,“在线教育”则通过专题视频资料、在线软件和在线一对一培训等形式随时随地学习科研数据管理方面的知识。但不论以哪种形式进行培训,其内容都涵盖科研数据管理的基础知识、科研数据管理的具体环境介绍、如何撰写科研数据管理计划、科研数据的保存与共享介绍等,培训有专人负责,能为每位科研工作者提供个性化培训服务且对校内的机构人员免费[24]。
伊利诺伊大学香槟分校图书馆科研数据服务提供有关科研数据管理计划、科研数据组织、科研数据保存与共享等相关培训,也提供个性化数据管理研讨会或研讨班、重新编排核心数据等培训,提供的培训形式更是涵盖了专题研讨会∕班、培训课、在线教育三种形式。例如:提供定期的专题研讨会∕班:2016年2月16日举办的“数据管理介绍专题研讨班”,主要介绍数据管理的要素:计划、组织、存储、构建等,与会者共同探讨相互帮助,找出彼此数据管理中存在的问题并学习如何解决;再如2016年3月1日举办的“研究数据的公开:公开什么、为何公开、如何公开专题研讨会”介绍科研数据出版或分享的基础知识,用一个框架模型来帮助研究者决定何时、如何公开科研数据[25]。伊利诺伊大学香槟分校也提供专业的数据管理教育培训课程,即数据管理教育培训项目,并授予数据管理专业硕士学位。该培训通过系统的课程学习(包括2门必修课和至少2门的选修课)、大量的实习(该校与全国范围内的自然科学、人文科学及其他人文数据研究中心合作,提供大量实习机会),培养科研工作者的科研数据管理能力[9]。同时,在科研数据服务的官网上,科研数据服务组也提供在线服务,可以提供在线学习和一对一专门性科研数据服务[26]。
2 伊利诺伊大学香槟分校图书馆科研数据服务的特点
2.1 良好的科研数据服务环境
伊利诺伊大学香槟分校图书馆拥有良好的科研数据服务环境。首先,该校图书馆拥有大型存储设备、高性能服务器及服务终端、软件系统、硬件设施等完整的基础设施,为科研数据服务提供良好的物质基础。例如:在数据存储方面,该校图书馆通过自建或与校园内其他部门(伊利诺伊隐私和信息保障办公室、机构审查委员会等)共同建设、研究存储大量信息的方式,从而完成对科研数据机构内部的存储,也建设相关的门户网站,完成数据门户方式存储;在对数字型科研数据的存储上,该校提供譬如IDEALS库(免费)和Data Dryad库(收费)的云服务共享的基础设施;而在数据共享方面,图书馆与校外联盟、组织、项目机构等合作开发数据共享的平台和技术,例如:与美国国家超级计算机应用中心合作,完成对敏感信息的存储,为研究者或团队提供存储大容量数据集的解决方案。其次,完整的软件工具支撑和软件服务为科研数据服务的开展创造良好的技术基础。例如:研究人员可通过图书馆官网、科研数据服务网站、学术共享网站等网页,链接到最新的文章或资源,也可链接到相关合作科研机构的网站等;图书馆科研数据服务组提供相关软件的免费下载服务,以及制定科研数据管理计划使用的在线向导DMP工具等。可以说,伊利诺伊大学香槟分校图书馆的科研数据服务拥有良好的物质、技术环境。 2.2 全面的科研数据服务内容
伊利诺伊大学香槟分校图书馆提供的科研数据服务内容全面,囊括科研数据生命周期的所有环节和模式:科研数据管理的计划、组织、保存与共享及培训。同时也细致入微,对科研活动的每个步骤都进行详细地指导和服务,细致到对科研人员如何选题、如何撰写项目申请书、如何查找资料、获取文献、交流协作、怎样使用计算机软件和硬件、怎样寻求图书馆员和专家的帮助、怎样撰写论文、发表研究成果、查引文献、如何获得科研数据管理教育培训、行政支持等工作都提供了细致地说明和服务[16]。例如:在制定科研数据管理计划时,该科研数据服务组详尽介绍如何开展科研项目并提供指导和帮助;在查引文献中,详细介绍使用文献的要求和规则、文献管理软件的使用等知识;在撰写项目申请书时对各个项目资助机构的要求进行汇总;在科研数据管理中,提供深入科研数据管理生命周期的科研数据服务,可派专员对不同时期的科研活动进行个性化科研数据管理等等。
2.3 成熟的科研数据服务团队
伊利诺伊大学香槟分校图书馆成立专门的科研数据服务组对科研数据管理进行专业协助,该科研数据服务组由专业人员组成,包括了该校图书馆的主管、科研编程员、数据综合管理专员、该校各学科领域的专家学者等。也根据每名成员的专业特长,将各个科研数据服务环节分配给不同的专员,将科研数据服务任务具体到每个人,合理分配科研数据服务任务。同时与美国国家图书馆总部、校内主管科研的副校长、院长办公室、校图书馆、校图书情报研究生院和国家超级计算机应用中心合作,成立学术共享圈,利用各领域专家学者共同进行科研数据管理,也定期对馆内工作人员进行培训以提高其信息素养。可以说,伊利诺伊大学香槟分校图书馆拥有信息素养较为成熟的科研数据服务团队。
2.4 系统的科研数据管理培训
伊利诺伊大学香槟分校图书馆为科研人员提供内容系统充实、形式多样的科研数据管理培训。首先,定期开展普适性的信息素养教育培训,让用户了解科研数据管理的目的、意义和要,熟悉数据管理的一般方法和术语,制定合理的数据管理计划等。例如:2016年2月至3月伊利诺伊大学香槟分校图书馆科研数据服务组开展的“数据管理”研讨班,讲解探讨基本的科研数据知识、科研数据管理方法等,利于科研工作者更好地开展科研数据管理工作。其次,伊利诺伊大学香槟分校图书馆科研数据服务组可根据科研人员的不同需求,针对某一领域或学科,制定专门的科研数据管理培训,为科研人员的科研数据培训提供一站式个性化服务,也可嵌入科研过程中进行服务和培训,提供相关基础设施、软件技术、专业人员等。最后,伊利诺伊大学香槟分校提供系统的数据管理培训项目,能为科研人员提供系统的科研数据管理培训。
3 启示
3.1 提高科研数据服务意识,建立良好的科研数据服务环境
通過对伊利诺伊大学香槟分校图书馆科研数据服务的研究,了解到其科研数据服务的完备性和先进性。因此,我们在科研数据服务方面应首先提高其服务意识,认识到科研数据服务对科研活动的重要性。其次要加强软硬件建设以及校内外和各研究机构间的合作,充分共享各自现有的设施和技术,为科研数据服务提供良好环境。
3.2 完善科研数据服务内容,成立专业的科研数据服务团队
再者,完善科研数据服务的内容,建立相应的科研数据服务网站,可根据科研数据管理生命周期,依次提供面向大众的、详尽的科研数据生命周期各阶段的指南、模板、咨询、培训等科研数据服务,开发完善的数据管理工具;同时成立专门的科研数据服务组,深入到每项科研活动中,提供个性化的科研数据服务,将科研数据服务细致到科研活动的每个细节,并对每项科研活动进行全程指导和个性化服务。再者,成立相关的管理团队,大力培育信息素养较高的数据管理人才,定期对管理机构内的专员进行培训,提高其数据管理和服务能力。同时细化的科研数据服务的每个步骤,分配给管理团队的各个部门、各个专员,使科研活动的每项工作具体到每位专员,使科研数据服务管理团队专业化、具体化。
3.3 完善科研数据管理培训,提高科研人员的科研数据管理能力
最后,制定系统的科研数据管理培训体系,举办关于科研数据管理的课程、研讨班、讲座等,定期对科研人员开展科研数据管理培训,提高科研人员的科研数据管理能力。
参考文献:
[ 1 ] 魏东原,朱照宇.专业图书馆如何实现科学数据共享[J].图书馆论坛.2007(12):253-256.
[ 2 ] 李丹丹,吴振新.研究数据管理服务综析[J].图书馆学研究,2012(9):54-59,69.
[ 3 ] 马建玲,祝忠明,王楠等.美国高校图书馆参与研究数据管理服务研究[J].图书情报工作.2012,56(21):77-82,142.
[ 4 ] Research Data Life cycle[EB/OL].[2016-06-01].http://www.data-aechive.ac.uk/create manage/life-cycle.
[ 5 ] 丁宁,马浩琴.国外高校科学数据生命周期管理模型比较研究及借鉴[J].图书馆情报工作,2013,6:18-22.
[ 6 ] 司莉,庄晓喆,王思敏等.2005年以来国外科学数据管理与共享研究进展与启示[J].国家图书馆学刊.2013,87:40-49.
[ 7 ] 孟祥保,钱鹏.高校社会科学数据管理的国际经验及其借鉴——以UKDA和ICPSR为例[J].情报资料工作.2013,2:77-80.
[ 8 ] US News Education[EB/OL].[2016-06-01].http://www.usnews.com/education/best global universities/search?name=Illinois+Urbana+Champaign. [ 9 ] 黄如花,吉翠芳.伊利诺伊香槟大学数据管理教育现状及启示[J].图书与情报.2015,1:61-65.
[10] About[EB/OL].[2016-06-01].http://researchdataservice.illinois.edu/about/.
[11] RDS Campus Annual Report 2015[EB/OL].[2016-06-10].https://www.ideals.illinois.edu/handle/2142/79493.
[12] Managing Research Data[EB/OL].[2016-06-10].https://www.ideals.illinois.edu/handle/2142 /79491.
[13] Plan[EB/OL].[2016-06-10].http://researchdataservice.illinois.edu/plan.
[14] Data Management Planning[EB/OL].[2016-06-10].http://researchdataservice.illinois.edu/plan.
[15] DMP Tool[EB/OL].[2016-04-14].http://dmp.cdlib.org.
[16] 王凯,彭洁,屈宝强.国外数据管理计划服务工具的对比研究[J].情报杂志,2014(12):203-206,169.
[17] 李晓辉.图书馆科研数据管理与服务模式探讨[J].中国图书馆学报.2011,195:46-52.
[18] IDEALS [EB/OL].[2016-06-20].http://www.ideals.illinois.edu.
[19] Scholarly Commons[EB/OL].[2016-06-21].http://www.illinois.edu/sc.
[20] Organizing Your Data[EB/OL].[2016-06-22].http://researchdataservice.illinois.edu/organize/.
[21] 周晓燕,宰冰欣.澳大利亚高校科研数据保存政策分析[J].图书情报知识.2016,02:122-128.
[22] 刘闯.美国国有科学数据共享管理机制及对我國的启示[J].中国基础科学.2003,1:34-39.
[23] Save and Sharing Your Data[EB/OL].[2016-06-23].http://research data service.illinois.edu/save/.
[24] 鄂丽君.国外大学图书馆的科研数据管理教育[J].情报资料工作.2014(1):101-105.
[25] Workshops[EB/OL].[2016-06-26].http://researchdataservice.illinois.edu/workshops/.
[26] Contact Us[EB/OL].[2016-06-27].http://researchdataservice.illinois.edu/contact-us.
柳 影 中国科学院大学、中国科学院文献情报中心硕士研究生。北京,北京,100049。
吴 鸣 中国科学院文献情报中心学科咨询服务部主任,研究馆员,硕士生导师。北京,100190。
胡 卉 中国科学院大学、中国科学院文献情报中心硕士研究生。北京,100049。
陈秀娟 中国科学院大学、中国科学院文献情报中心硕士研究生。北京,100049。
(收稿日期:2016-08-17 编校:刘 明)
关键词 科研数据服务 数据管理 伊利诺伊大学香槟分校图书馆
分类号 G252.6
DOI 10.16810/j.cnki.1672-514X.2017.05.×××
Abstract Research data service is provided by libraries and research establishments to researchers for the purpose of promoting research activities. At present, research data services have been attracted widespread attention, and foreign universities have formed the mature system of research data service. This paper takes the research data service of the University of Illinois at Urbana-Champaign Library as the research case, and summarizes the contents and characteristics of its research data service, so as to provides suggestions for the research data service of the libraries in our country.
Keywords Research data services. Data management. University of Illinois at Urbana-Champaign Library.
0 引言
科研数据是人类在进行科学研究的整个过程中产生、加工的数据、数据产品及其相关信息[1],是科学研究的产物。从范围来看,科研数据不仅包括自然科学的数据,也包括考古学、文学、历史学、政治学等各学科领域的数据;从内容来看,包括原始数据及其相关的元数据等信息[2]。依据数据来源可将科研数据分为观测数据observational data、实验数据experimental data、仿真数据simulation data、派生数据或编译数据derived or compiled data和参考数据或规范数据reference or canonical data五种类型[3]。科研数据管理是以科研数据为管理对象的一项工作,以数据生命周期为基础,即科研数据管理以创建数据、处理数据、分析数据、长期保存数据、获取数据、重用数据这六个阶段为基础[4]。科研数据服务是图书馆、科研机构面向科研工作者提供的,主要包括科研数据管理规划服务、数据描述和存档服务、科研数据管理教育培训服务、关联环境性服务等[5]。
目前,科研数据服务受到业界广泛重视,催生了一系列专业从事数据管理的组织机构,如1957年成立的世界数据中心(World Data Center,简称WDC)、1966年成立的国际科技数据委员会(Committee on Data for Science and Technology,简称CODATA)[6]、1947年美国建立的数据档案管理部门——罗普中心(Roper Center)等,截至2013年国际上注册的国家级社会科学数据管理机构会员已达35个[7]。同时,国外高校图书馆也纷纷开展科研数据服务,如麻省理工学院、哈佛大学、约翰霍普金斯大学、加州大学洛杉矶分校、伯克利分校、伊利诺伊大学、康纳尔大学、牛津大学、剑桥大学、坦佩雷大学、莫纳什大学、奥克兰大学等。而作为“美国公立大学三巨头”、2016年《美国新闻与世界报道》世界排名第43位[8]的伊利诺伊大学(University of Illinois,简称UI)更是对科研数据服务极为重视,不仅开展数据管理教育认证项目(Data Curation Education Program,简称DCEP)[9],而且该校图书馆提供完整的科研数据服务且该科研数据服务体系已较为成熟,成为各高校图书馆科研数据服务的楷模,其中以伊利诺伊大学厄巴纳—香槟分校图书馆的科研数据服务为最。
1 伊利诺伊大学香槟分校图书馆科研数据服务内容
伊利诺伊大学香槟分校图书馆的科研数据服务(Research Data Services,简称RDS)依据數据生命周期,主要从数据管理、数据组织、数据存储和备份三个方面进行科研数据服务,为伊利诺伊大学所有研究者提供专业知识、专业工具和基础设施,从而起到管理和组织科研数据、促进科研活动顺利进行的作用。
伊利诺伊大学香槟分校图书馆提供的主要资源服务包括:(1)科研数据管理和共享的平台;(2)促使科研数据组织、处理、传输且符合要求的技术;(3)保存和分享科研数据的校园基础设施[10]。同时提供数据管理教育和相关认证,定期发布科研数据服务报告,例如2016年1月30日发布的《管理科研数据》报告[11]、2015年伊利诺伊大学香槟分校的科研数据管理服务报告等[12]。该校科研数据服务与美国国家图书馆总部、美国国家超级计算机应用中心、校图书馆、校图书情报研究生院等联合主办,汇集科研数据管理、数据综合处理及各学科领域专家,形成包含科研数据管理计划、科研数据组织、科研数据保存与共享、科研数据管理培训四部分的科研数据服务体系。 1.1 科研数据管理计划
科研数据管理计划即在科学研究开始之初,制定对科研过程中所产生、使用的数据进行管理的计划,是科研数据管理的总纲。美国国家科学基金会(National Science Foundation,简称NSF)要求从2011年开始资助的科研项目均要有数据管理计划(Data Management Plan,简称DMP),且很多科研基金机构对于DMP的结构、包含的内容等要求各有不同,NSF更是对不同学科领域的DMP提出了不同的要求。因此,伊利诺伊大学香槟分校图书馆科研数据服务组为科研工作者提供详尽的各机构的科研数据管理计划要求,并提供相应的咨询指导服务,以促使科研工作者顺利完成科研数据管理计划。
伊利诺伊大学香槟分校图书馆科研数据服务组总结出科研数据管理计划应具备数据存储、数据命名、数据共享、科研活动时间分配、科研活动的人员分配、数据的参考资料和政策、成果的归属于权利等内容。同时在制定科研数据管理计划时要注意以下五点:
(1)科研数据管理计划要预测科研活动中使用的软件和被存储的数据类型。例如:一些工具需要特殊或合适的软件,而一些项目需要大量的数据(包括文件的数量和大小),要事先计划这些事务,在管理计划中加以说明和处理,促使科研数据管理过程中不受干扰。
(2)要计划好创造或采用的标准术语和命名规则。例如:创造了一套个人使用的命名规则后就一直使用,或采用通用的标准化术语和命名规则,此举利于数据管理、查找和存储。
(3)制定好科研活动时间表,详述科研数据管理过程中每一时期的工作,划定时间期限。
(4)分配好科研活动中参与人员的责任。例如:安排专员进行数据备份,或安排专员进行数据搜集等,将每项科研活动具体到个人身上。
(5)要考虑好数据长期保存、数据的分享、数据的归属和权利等问题[13]。同时,伊利诺伊大学香槟分校图书馆科研数据服务组汇总了主要科研机构科研数据管理计划要求(详见表1、表2),并以此要求为基准为科研工作者提供科研数据管理计划模板和指导。
伊利诺伊大学香槟分校图书馆科研数据服务组提供制定科研数据管理计划使用的工具是DMP Tool工具,它可以为特定的研究项目和资助机构创建一份准备使用的科研数据管理计划,提供一份科研数据管理计划的模板,方便科研工作者制定管理计划。它是由美国加利福尼亚大学信息中心的数字图书馆( California Digital Library) 开发的,提供多种符合科研资助机构数据政策要求的科研数据管理计划模板,用户可根据需要创建。主要服务有三项:(1)帮助用户创建和维护不同版本的数据管理计划,并根据要求输出不同格式的数据管理计划;(2)为科研工作者提供各个机构的数据管理问题及如何满足基金的要求的指南;(3)為科研工作者提供数据管理计划的培训及咨询[15]。DMP Tool 工具创建的科研数据管理计划主要有四个部分:概述计划总体情况、详述计划细节、设置计划权限、导出计划。用户在使用DMP Tool时只需选择伊利诺伊大学香槟分校登录在校账户即可进入创建管理计划,选择对应的基金机构数据管理计划要求的模板,根据提示回答问题,在模板上编辑管理计划即可完成[16]。综上,伊利诺伊大学香槟分校图书馆的科研数据管理计划提供科研数据管理计划制定指南、科研数据管理计划要素、模板、工具以及科研数据管理计划的咨询服务和教育培训。
1.2 科研数据的组织
目前,图书馆对科研数据的组织按其存储地点分为两种:机构仓储方式组织数据,即对存储在图书馆或机构内的数据进行组织;数据门户方式组织数据,即对存储在图书馆外的数据进行组织[17]。其中机构仓储组织数据,就是将科研工作者在科研活动中的数据保存在该机构的机构仓储内,并进行数据组织,从而保存机构成员的研究成果,为其提供出版机会。在机构仓储中组织数据更快速、及时,有利于降低数字过时的风险,促进未来研究的可持续性,同时,机构成员可通过机构仓储实时上传数据,扩大数据影响范围,降低数据共享成本。而对于存储在机构外的科研数据,则通过建立科研数据门户网站的方式进行数据组织。此举通过网页链接到其他存储中心,将科研数据、与科研数据相关的资料汇集,建立起符合研究环境的科研数据组织体系,使科研数据在统一的环境下进行组织,保证科研数据组织的一致性、便捷性,利于长期保存[17]。
伊利诺伊大学香槟分校图书馆科研数据服务组提供机构仓储组织数据和数据门户方式组织数据两种方法。在机构仓储组织数据方面,建立了IDEALS数据库进行组织。IDEALS库收集了伊利诺伊大学所有科研工作者的科研数据,在此数据库中科研工作者可管理、上传、组织自己的科研数据,也可了解他人的科研成果[18]。而在数据门户方式组织数据上,伊利诺伊大学则建立了学术共享圈(The Scholarly Commons)用于支持科研工作者发现、获取、使用和管理科研数据,该网页设有著作权、数据发现、数据支持、电子数据智能化等服务导航,也提供相应的软件下载导航等[19]。最后,伊利诺伊大学香槟分校图书馆科研数据服务组提供科研数据组织指南、强调科研数据组织要素并提供科研数据组织的咨询及培训。例如:提供的科研数据组织指南中强调对科研数据进行组织时,要首先考虑对数据的命名,使用系统的、一致的命名准则,尽量避免使用特殊字符和空格(用下划线代替),不使用文件名去描述文件,在命名过程中考虑项目名称/缩写、实验/仪器的类型、信息的位置、研究者姓名的首字母、日期、版本号等。伊利诺伊大学香槟分校图书馆科研数据服务组也强调科研数据组织的要素,如要做好版本跟踪,要一直保存一份从未复制过的原始数据,或长期保存一份纯文本格式数据,只在原始文件的复制件上进行分析、排序、细化、或进行其他操作,同时也要对元数据进行描述,要注意元数据题目、数据类型、发布者、时间等要素,以确保搜集到的资料不会丢失,为数据提供一段重要信息的描述[20]。 1.3 科研数据保存与共享
科研数据的保存是日后的科研利用的基础,是科研活动的顺利进行的必要保证,因此,在科研数据服务中科研数据的保存极为重要。科研数据的保存要注意提高科研数据使用的持久性、完善科研数据的可访问性,确保科研数据的真实、完整。科研数据保存包括七个环节:(1)科研数据保存前的准备工作,包括要确定所保存的科研数据的类型、对科研数据进行注册、对科研数据进行描述,其中要确保科研数据保存的类型一致,对科研数据进行描述时要遵守元数据标准,将科研数据标准化;(2)规定科研数据保存的年限,在确定各个科研数据集的保存年限前,要将科研数据进行分类,对不同类型的科研数据集进行保存年限的规定,要使用同一套分类标准划分科研数据,并使用统一标准保存科研数据集;(3)规定科研数据的保存位置,要对数字型科研数据和非数字型科研数据的保存位置进行区分规定,保证保存位置的可访问性;(4)规定科研数据保存位置变更的细节,要详细记录科研数据保存位置变更的整个过程,及时更新科研数据保存位置变更的信息;(5)规定科研数据的保存格式,要统一科研数据的保存格式,进行标准化,同时使用开放性的保存格式,保证数据在转换过程中不丢失;(6)规定超出保存期限的科研数据的销毁工作,对不同类型的科研数据采用不同的销毁方法,同时确保科研数据销毁后的不可逆性;(7)规定科研数据的备份,对科研活动前、中、后不同时期的科研数据进行及时备份,并确保备份的安全性[21]。
科研数据的共享是科研工作者进行交流学习的保障,建立在良好的科研数据保存的基础上的科研数据共享,能更好地促进科研工作者之间的交流。因此,科研数据共享不仅是科研数据管理的重要内容,更是科研数据服务的重中之重。科研工作者在进行科研数据共享时,要规定好版权和许可,确定获取权限,制定共享协议,确定共享方式,也要做好保密机制与开放共享机制的结合,既要保证科研数据的广泛交流,也要做好科研数据中重要数据的保密[22]。
伊利诺伊大学香槟分校图书馆科研数据服务组提供大容量数据的存储,例如:伊利诺伊的IDEALS库(免费)和Data Dryad库(收费);在数据共享中提供科研数据安全管理措施,成立专门机构——伊利诺伊隐私和信息保障办公室(Illinois’ Office of Privacy and Information Assurance,简称OPIA)保障数据存储、共享的安全,其主要工作是对敏感数据提供数据分类指导和培训,同时该机构还联合该校机构审查委员会(Institution Review Board,简称IRB)、美国国家超级计算机应用中心(National Center for Supercomputer Application,简称NCSA)共同研究如何安全地存储大量的敏感数据,为科研数据提供永久保存和长期访问。同时该校科研数据服务组也对科研数据的保存与共享提供指导说明、培训、咨询,例如:服务组强调要做好科研数据的备份,至少保存三份存储位置不同的文件;做好重要数据的长期访问归档等,并定期开展以科研数据保存与共享为主題的培训[23]。
1.4 科研数据管理培训
根据调查国外高校图书馆的科研数据管理培训主要有三种形式:专题研讨会∕班、培训课、在线教育[24]。“专题研讨会∕班”的形式较为自由,参与者可相互交流心得,“培训课”则能较为系统地学习科研数据管理的相关知识,“在线教育”则通过专题视频资料、在线软件和在线一对一培训等形式随时随地学习科研数据管理方面的知识。但不论以哪种形式进行培训,其内容都涵盖科研数据管理的基础知识、科研数据管理的具体环境介绍、如何撰写科研数据管理计划、科研数据的保存与共享介绍等,培训有专人负责,能为每位科研工作者提供个性化培训服务且对校内的机构人员免费[24]。
伊利诺伊大学香槟分校图书馆科研数据服务提供有关科研数据管理计划、科研数据组织、科研数据保存与共享等相关培训,也提供个性化数据管理研讨会或研讨班、重新编排核心数据等培训,提供的培训形式更是涵盖了专题研讨会∕班、培训课、在线教育三种形式。例如:提供定期的专题研讨会∕班:2016年2月16日举办的“数据管理介绍专题研讨班”,主要介绍数据管理的要素:计划、组织、存储、构建等,与会者共同探讨相互帮助,找出彼此数据管理中存在的问题并学习如何解决;再如2016年3月1日举办的“研究数据的公开:公开什么、为何公开、如何公开专题研讨会”介绍科研数据出版或分享的基础知识,用一个框架模型来帮助研究者决定何时、如何公开科研数据[25]。伊利诺伊大学香槟分校也提供专业的数据管理教育培训课程,即数据管理教育培训项目,并授予数据管理专业硕士学位。该培训通过系统的课程学习(包括2门必修课和至少2门的选修课)、大量的实习(该校与全国范围内的自然科学、人文科学及其他人文数据研究中心合作,提供大量实习机会),培养科研工作者的科研数据管理能力[9]。同时,在科研数据服务的官网上,科研数据服务组也提供在线服务,可以提供在线学习和一对一专门性科研数据服务[26]。
2 伊利诺伊大学香槟分校图书馆科研数据服务的特点
2.1 良好的科研数据服务环境
伊利诺伊大学香槟分校图书馆拥有良好的科研数据服务环境。首先,该校图书馆拥有大型存储设备、高性能服务器及服务终端、软件系统、硬件设施等完整的基础设施,为科研数据服务提供良好的物质基础。例如:在数据存储方面,该校图书馆通过自建或与校园内其他部门(伊利诺伊隐私和信息保障办公室、机构审查委员会等)共同建设、研究存储大量信息的方式,从而完成对科研数据机构内部的存储,也建设相关的门户网站,完成数据门户方式存储;在对数字型科研数据的存储上,该校提供譬如IDEALS库(免费)和Data Dryad库(收费)的云服务共享的基础设施;而在数据共享方面,图书馆与校外联盟、组织、项目机构等合作开发数据共享的平台和技术,例如:与美国国家超级计算机应用中心合作,完成对敏感信息的存储,为研究者或团队提供存储大容量数据集的解决方案。其次,完整的软件工具支撑和软件服务为科研数据服务的开展创造良好的技术基础。例如:研究人员可通过图书馆官网、科研数据服务网站、学术共享网站等网页,链接到最新的文章或资源,也可链接到相关合作科研机构的网站等;图书馆科研数据服务组提供相关软件的免费下载服务,以及制定科研数据管理计划使用的在线向导DMP工具等。可以说,伊利诺伊大学香槟分校图书馆的科研数据服务拥有良好的物质、技术环境。 2.2 全面的科研数据服务内容
伊利诺伊大学香槟分校图书馆提供的科研数据服务内容全面,囊括科研数据生命周期的所有环节和模式:科研数据管理的计划、组织、保存与共享及培训。同时也细致入微,对科研活动的每个步骤都进行详细地指导和服务,细致到对科研人员如何选题、如何撰写项目申请书、如何查找资料、获取文献、交流协作、怎样使用计算机软件和硬件、怎样寻求图书馆员和专家的帮助、怎样撰写论文、发表研究成果、查引文献、如何获得科研数据管理教育培训、行政支持等工作都提供了细致地说明和服务[16]。例如:在制定科研数据管理计划时,该科研数据服务组详尽介绍如何开展科研项目并提供指导和帮助;在查引文献中,详细介绍使用文献的要求和规则、文献管理软件的使用等知识;在撰写项目申请书时对各个项目资助机构的要求进行汇总;在科研数据管理中,提供深入科研数据管理生命周期的科研数据服务,可派专员对不同时期的科研活动进行个性化科研数据管理等等。
2.3 成熟的科研数据服务团队
伊利诺伊大学香槟分校图书馆成立专门的科研数据服务组对科研数据管理进行专业协助,该科研数据服务组由专业人员组成,包括了该校图书馆的主管、科研编程员、数据综合管理专员、该校各学科领域的专家学者等。也根据每名成员的专业特长,将各个科研数据服务环节分配给不同的专员,将科研数据服务任务具体到每个人,合理分配科研数据服务任务。同时与美国国家图书馆总部、校内主管科研的副校长、院长办公室、校图书馆、校图书情报研究生院和国家超级计算机应用中心合作,成立学术共享圈,利用各领域专家学者共同进行科研数据管理,也定期对馆内工作人员进行培训以提高其信息素养。可以说,伊利诺伊大学香槟分校图书馆拥有信息素养较为成熟的科研数据服务团队。
2.4 系统的科研数据管理培训
伊利诺伊大学香槟分校图书馆为科研人员提供内容系统充实、形式多样的科研数据管理培训。首先,定期开展普适性的信息素养教育培训,让用户了解科研数据管理的目的、意义和要,熟悉数据管理的一般方法和术语,制定合理的数据管理计划等。例如:2016年2月至3月伊利诺伊大学香槟分校图书馆科研数据服务组开展的“数据管理”研讨班,讲解探讨基本的科研数据知识、科研数据管理方法等,利于科研工作者更好地开展科研数据管理工作。其次,伊利诺伊大学香槟分校图书馆科研数据服务组可根据科研人员的不同需求,针对某一领域或学科,制定专门的科研数据管理培训,为科研人员的科研数据培训提供一站式个性化服务,也可嵌入科研过程中进行服务和培训,提供相关基础设施、软件技术、专业人员等。最后,伊利诺伊大学香槟分校提供系统的数据管理培训项目,能为科研人员提供系统的科研数据管理培训。
3 启示
3.1 提高科研数据服务意识,建立良好的科研数据服务环境
通過对伊利诺伊大学香槟分校图书馆科研数据服务的研究,了解到其科研数据服务的完备性和先进性。因此,我们在科研数据服务方面应首先提高其服务意识,认识到科研数据服务对科研活动的重要性。其次要加强软硬件建设以及校内外和各研究机构间的合作,充分共享各自现有的设施和技术,为科研数据服务提供良好环境。
3.2 完善科研数据服务内容,成立专业的科研数据服务团队
再者,完善科研数据服务的内容,建立相应的科研数据服务网站,可根据科研数据管理生命周期,依次提供面向大众的、详尽的科研数据生命周期各阶段的指南、模板、咨询、培训等科研数据服务,开发完善的数据管理工具;同时成立专门的科研数据服务组,深入到每项科研活动中,提供个性化的科研数据服务,将科研数据服务细致到科研活动的每个细节,并对每项科研活动进行全程指导和个性化服务。再者,成立相关的管理团队,大力培育信息素养较高的数据管理人才,定期对管理机构内的专员进行培训,提高其数据管理和服务能力。同时细化的科研数据服务的每个步骤,分配给管理团队的各个部门、各个专员,使科研活动的每项工作具体到每位专员,使科研数据服务管理团队专业化、具体化。
3.3 完善科研数据管理培训,提高科研人员的科研数据管理能力
最后,制定系统的科研数据管理培训体系,举办关于科研数据管理的课程、研讨班、讲座等,定期对科研人员开展科研数据管理培训,提高科研人员的科研数据管理能力。
参考文献:
[ 1 ] 魏东原,朱照宇.专业图书馆如何实现科学数据共享[J].图书馆论坛.2007(12):253-256.
[ 2 ] 李丹丹,吴振新.研究数据管理服务综析[J].图书馆学研究,2012(9):54-59,69.
[ 3 ] 马建玲,祝忠明,王楠等.美国高校图书馆参与研究数据管理服务研究[J].图书情报工作.2012,56(21):77-82,142.
[ 4 ] Research Data Life cycle[EB/OL].[2016-06-01].http://www.data-aechive.ac.uk/create manage/life-cycle.
[ 5 ] 丁宁,马浩琴.国外高校科学数据生命周期管理模型比较研究及借鉴[J].图书馆情报工作,2013,6:18-22.
[ 6 ] 司莉,庄晓喆,王思敏等.2005年以来国外科学数据管理与共享研究进展与启示[J].国家图书馆学刊.2013,87:40-49.
[ 7 ] 孟祥保,钱鹏.高校社会科学数据管理的国际经验及其借鉴——以UKDA和ICPSR为例[J].情报资料工作.2013,2:77-80.
[ 8 ] US News Education[EB/OL].[2016-06-01].http://www.usnews.com/education/best global universities/search?name=Illinois+Urbana+Champaign. [ 9 ] 黄如花,吉翠芳.伊利诺伊香槟大学数据管理教育现状及启示[J].图书与情报.2015,1:61-65.
[10] About[EB/OL].[2016-06-01].http://researchdataservice.illinois.edu/about/.
[11] RDS Campus Annual Report 2015[EB/OL].[2016-06-10].https://www.ideals.illinois.edu/handle/2142/79493.
[12] Managing Research Data[EB/OL].[2016-06-10].https://www.ideals.illinois.edu/handle/2142 /79491.
[13] Plan[EB/OL].[2016-06-10].http://researchdataservice.illinois.edu/plan.
[14] Data Management Planning[EB/OL].[2016-06-10].http://researchdataservice.illinois.edu/plan.
[15] DMP Tool[EB/OL].[2016-04-14].http://dmp.cdlib.org.
[16] 王凯,彭洁,屈宝强.国外数据管理计划服务工具的对比研究[J].情报杂志,2014(12):203-206,169.
[17] 李晓辉.图书馆科研数据管理与服务模式探讨[J].中国图书馆学报.2011,195:46-52.
[18] IDEALS [EB/OL].[2016-06-20].http://www.ideals.illinois.edu.
[19] Scholarly Commons[EB/OL].[2016-06-21].http://www.illinois.edu/sc.
[20] Organizing Your Data[EB/OL].[2016-06-22].http://researchdataservice.illinois.edu/organize/.
[21] 周晓燕,宰冰欣.澳大利亚高校科研数据保存政策分析[J].图书情报知识.2016,02:122-128.
[22] 刘闯.美国国有科学数据共享管理机制及对我國的启示[J].中国基础科学.2003,1:34-39.
[23] Save and Sharing Your Data[EB/OL].[2016-06-23].http://research data service.illinois.edu/save/.
[24] 鄂丽君.国外大学图书馆的科研数据管理教育[J].情报资料工作.2014(1):101-105.
[25] Workshops[EB/OL].[2016-06-26].http://researchdataservice.illinois.edu/workshops/.
[26] Contact Us[EB/OL].[2016-06-27].http://researchdataservice.illinois.edu/contact-us.
柳 影 中国科学院大学、中国科学院文献情报中心硕士研究生。北京,北京,100049。
吴 鸣 中国科学院文献情报中心学科咨询服务部主任,研究馆员,硕士生导师。北京,100190。
胡 卉 中国科学院大学、中国科学院文献情报中心硕士研究生。北京,100049。
陈秀娟 中国科学院大学、中国科学院文献情报中心硕士研究生。北京,100049。
(收稿日期:2016-08-17 编校:刘 明)