科学数据共享:挑战与实践

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:SnailHou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学数据已渗透到科学研究的方方面面,科学数据已进入“大数据”时代。科学数据共享现今仍具有重要的意义和迫切的实际需求。进行科学数据共享,可以支持科学研究的再现和验证,也能有助于研究者利用现有研究新的科学问题,更有助于提升科学研究和创新的水平,促进科学的可持续发展。但由于科学数据共享的复杂性,尤其是地球科学领域,在科学数据的收集、汇交、发布、共享、激励、评价等方面仍面临诸多挑战。  本文以科学数据共享为核心,在回顾科学数据共享的发展历史基础上,从研究科学数据共享的概念、内容与技术为起点,阐述科学数据共享的理念,以科学数据共享平台的设计与实现为工具,结合科学数据的汇交与共享具体实践,以分析和评价科学数据共享的实际成效为终点。科学数据共享的本质就是科学数据的开放和共用,并在共享过程中发挥科学数据更大的价值。为实现共享的本质目标,科学数据共享平台包括三个核心部分即汇交或整理、数据管理、数据发现和获取,三个部分分别针对数据提供者、科学数据中心以及数据用户,科学数据共享平台的核心任务就是满足这三类用户的实际需求。科学数据共享的动力主要有两个方面,即推动科学的发展以及寻求科学研究的再现和验证。而科学数据共享面临的挑战是多方面的,包括数据量的持续增长和数据存储的挑战、保证可持续共享的挑战、科学数据汇交的挑战、科学数据的质量问题等方面。国内在科学数据共享方面也存在对应挑战,同时存在其他问题,包括没有明确的科学数据汇交政策、不完善的科学数据共享体系、知识产权不重视等。科学数据共享可以利用的技术有元数据、数据标识与引用、数据访问与获取等方面。  本文在理解科学数据共享需求的基础上,探讨了科学数据共享涉及到的各利益相关者的实际利益需求,设计了一套可用于实际业务的科学数据共享流程,包括数据共享流程、数据申请流程、离线申请管理流程以及数据发布流程,并定义了元数据评审和文献支持两种科学数据共享平台需要的扩展功能。以元数据为核心,对内联系科学数据实体,对外科学数据共享功能。以现有开源技术为基础,自主实现了一套功能可扩展的科学数据共享平台,并在科学数据共享实践过程中逐步优化并调整相应的功能实现,核心功能覆盖了科学数据的发现、获取、发布和服务等并以此数据共享平台为核心,扩展实现科学数据共享的辅助功能,包括科学数据的知识挖掘功能以及科学数据库的对外共享功能,以应对科学数据共享的诸多挑战。在进行科学数据共享实践过程中,介绍了三个具体的共享实践,包括中国西部环境与生态科学数据中心的数据共享实践、黑河综合遥感联合试验的数据共享实践以及黑河计划数据管理中心的数据共享实践。在中国西部环境与生态科学数据中心实践过程中,形成了一套适合科学数据共享的方法体系,包括保证科学数据的有效信息传递、保证科学数据共享中的利益相关者的权益、保证科学数据共享的可持续发展等方面。在黑河综合遥感联合试验数据共享过程中,对共享系统进行了拓展,对科学数据及期刊文献进行了对应管理,并采用元数据分析方法介绍了黑河综合遥感联合试验的数据概貌。在黑河计划数据管理中心实践过程中,从制度和技术上实现了科学数据汇交支持,更加重视数据作者的权益保证,同时集成了黑河流域生态水文观测数据库,解决了黑河计划数据共享的实际挑战。  本文基于WATER数据共享服务的实际成效,对科学数据共享的成效分析进行了探讨。在服务成效分析上,从用户申请的数据结果分析了用户申请数据的时间热点、空间热点以及主题热点,从申请数据的用户行为分析了用户的时间、单位、项目以及与WATER项目组的关系。在文献分析方面,对WATER数据产出的文献进行了分类,认为其包括专题文献、引证文献以及数据作者推荐文献三个类别,并从期刊来源、文献作者、研究主题三个方面进行了分析。同时针对WATER专题分析了科学数据共享在提升文献引用方面的积极作用。利用定量化的访问、下载、引用数据分析了WATER数据集在共享时这三类定量数据之间的关系,并分析了从访问到下载、从下载到引用的统计规律。最后,基于科学数据共享的实践结果,我们尝试总结科学数据共享的成效并评价科学数据共享过程。利用科学数据中心的成效分析数据,发现了科学数据中心也存在着马太效应和长尾效应。利用网络信息计量学方法和网站访问记录方法评价西部数据中心的共享成效。在这两个科学数据共享评价的实例基础上,参照期刊文献评价方法提出了一种面向数据的科学数据共享评价框架,定义了单一科学数据评价模型以及科学数据集合评价模型,并以西部数据中心的数据集和WATER数据集为例探讨了科学数据共享评价实例。
其他文献
用GIS空间分析方法对中国区域经济发展与环境关系进行分类研究, 并分析不同经济发展阶段经济与环境协调的条件与演变趋势,为区域经济决策提供依据.因此,该文从理论与内容上看
以居民地为中心,作了如下研究:对NOAA AVHRR图象上的居民地进行了影象特征、光谱特征的研究,从中发现光谱知识,并建立了基于光谱知识的居民地提取模型.分别对三种星载雷达图
在对中国贫困状况的变化以及反贫困策略进程详细回顾的同时,论文分析了贫困在中国实现可持续发展中的阻碍作用;并总结了目前在中国反贫困战场中越来越活跃的小额信贷同和国际
干旱灾害是世界范围内普遍存在的一种自然灾害,随着全球气候变化,尤其在气候变暖的背景下,干旱灾害给全世界,特别是发展中国家造成的潜在威胁越来越大。干旱灾害风险评估在灾害管
该文选择城市人居环境矛盾最集中的城市化地区为研究对象,综合考虑组成城市人居环境各要素的复杂关系,探讨城市化进程中人居环境可持续发展的评价监控体系和研究方法.
陆面蒸散发包括土壤蒸发和植被蒸腾两部分,是能量循环和水分循环的重要环节,准确估算陆面蒸散发对水文和气候等研究具有重要的现实意义。黑河中游地区是典型的干旱地区,以灌溉农
“周恩来精神与风范研讨会”综述潘洪声1998年3月5日,是周恩来同志诞辰100周年纪念日。为了纪念周恩来,缅怀这位世纪伟人的丰功伟绩和高尚的精神风范,中国中共党史学会、中共重庆市委党史
学科交叉、融合已成为当代科学发展的主要特点之一,多学科的协同、交叉是科学发展的必然趋势。文献计量学和地理信息系统(GIS)的集成是一个新的发展方向,近10年来,GIS技术在文献
中国对城市边缘区小城镇的研究方兴未艾.但随着交通、通讯设施的完善,社会主义市场经济体制的建立和农村基层管理体制的变化,边缘镇的发展面临新的问题.为探讨这些问题和寻求
<正>由浙江大学教授黄寿波等编著的《茶树优质高产栽培与气象》一书,已由气象出版社出版发行,该书是"十一五"国家重点图书,农村气象防灾减灾科普系列丛书之一。作者根据我国