开放科学背景下科学数据管理的溯源模型及应用研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:shiqiuqiu100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息科学技术正飞速发展,不断产生和积累海量的科学数据,且数据的多源性和复杂性也在不断加剧,而这些科学数据是科学研究和进一步探究知识的基础。现阶段,存在一套简洁且可衡量的数据管理原则——FAIR原则,为提高科学数据监管与治理效能,促进科学数据的开放共享,实现数据资源的最大限度重用等方面,提供了重要指导依据。其中,FAIR原则要求科学数据发布时伴有溯源信息。一方面,溯源信息可以对科学数据进行标注和补充,以作为数据追踪的参考依据;另一方面,溯源很大程度提高所采用科学数据的可信度,便于检查数据质量。实现科学数据的溯源对于高质量的科学数据管理意义非凡。目前,我国已采用各种手段监管与治理科学数据与生命周期,但较少将数据溯源技术应用至科学数据管理。针对以上背景与问题,本文将数据管理计划与FAIR原则,融合至科学数据的生命周期,研究不同角色和工具在各环节中发挥的作用,并建立溯源模型,使用本体将用于描述生命周期管理的类映射到统一的溯源模型中,再现科学数据变化的过程,充分满足科学数据的可重用性。本文的工作包括:(1)收集国内外采用的数据管理方法和通用数据管理计划,分析其特点和使用要求,研究使数据管理计划与FAIR原则相融合的方式,用于指导后续科学数据管理。(2)介绍国内外数据生命周期模型阶段、分析我国数据管理的良好实践,梳理出科学数据生命周期全流程,融入DMP与FAIR原则,建立面向科学领域数据生命周期管理框架。(3)根据科学数据的领域特点,拓展相关的本体,如组织本体和工具本体。从科学数据管理的要求出发,引入关于角色和工具的新类,构建本体驱动的科学数据管理溯源模型,采用RDF/XML语言对模型做形式化表达,充分描述角色和工具等溯源信息。(4)应用科学数据溯源模型。重点分析了以下四个应用场景的溯源:科研项目内部科学数据FAIR化、科学数据平台数据汇交、使用层面语义标注、科学资源间引用。使用Turtle和RDF/XML格式进行溯源编码,描述出实例的溯源信息,并将部分过程的溯源记录发布出来,通过SPARQL查询溯源关键信息。本文旨在加深面向科学数据管理的溯源研究与应用实践,以期提高我国科学数据管理水平,为科学数据管理领域的相关人员提供借鉴和参考。
其他文献
随着工业制造企业的迅猛发展,大宗货物的运输需求日益增长。大宗货物的生产和运输有其特殊性,在生产方面,主要体现在大宗货物一次生产所产生的货物数量巨大、生产周期不确定,在运输方面只要能够将货物如期运达即可,而对每次运输的批次没严格限定,从运输成本方面考虑,通常考虑采用水运方案。因此,鉴于大宗货物运输的特性,设计良好的大宗货物水运方案,对提高物流效率,节约物流成本有重要意义。本文以代表大宗货物的某大型钢
学位
物流业身为经济系统中的重要基础性、战略性地位的产业,促进其发展质量提升是降低实体经济尤其是制造业、农业等企业物流成本费用水平、激发实体经济活力的必然要求,是推进供给侧结构性改革、提高经济社会运行效率、激发经济发展内生动能的迫切要求,是建设社会主义现代化经济体系、促进整个国民经济高质量高水平发展的内在需要。当前,中国物流业已经经历过了艰难漫长的成长期,并正在以较高水平增速步入成熟期,逐步实现跨越式发
学位
随着我国水路运输业持续稳定地发展,水域中航行的船舶数量逐渐增多,航线通航密度也不断增大。这直接导致我国水上交通安全的风险日益攀升,给人们的生命和财产安全构成了巨大的威胁,对社会和经济的发展产生了一定的制约作用。如何精准高效地分析预测水上交通事故、提升水上交通安全等级成为近些年的研究热点。然而,因存在水上交通事故信息库不完备的桎梏,当前相关研究在获取水上交通事故数据时需耗费大量精力,一定程度上阻碍了
学位
近年来,债券市场成为中国金融市场体系中最具活力的部分,在提高市场融资效率、服务实体经济方面发挥了重要作用。信用债作为企业,特别是非上市企业融资的关键渠道之一,已成为我国债券市场的重要组成部分,投资者队伍不断壮大。然而与信用债市场隆隆日上相伴而来的,是违约乱象的频生。因此构建较为完善的发债主体信用风险评价体系对于规避信用风险和经济损失、促进金融市场稳健发展不可或缺。本文通过分析发债企业信用风险评价模
学位
在电商领域,商品的评论信息无论对于消费者还是营销者都具有非常重要的参考意义,随着电商平台技术的发展,评论信息规模不断扩大的同时,信息类别也呈现多样化的特征,图文混合数据已成为电商评论的重要表现形式。但是在中文评论领域,目前没有一个比较成熟的公开数据集来满足深度学习网络模型训练要求,另外图像和文本的数据挖掘方法已经比较成熟,而如何将两种单模态数据挖掘方法进行有效融合是当前研究的热点问题。为了能够挖掘
学位
新时代以来,我国经济已由高速增长阶段转变为高质量发展阶段,面临产业结构转型升级新任务,亟需培育经济增长新动力。当前,专家学者们普遍认为以人工智能为核心的新科技革命先导技术是最有能力也是最有希望助推我国产业结构转型升级的武器。习近平总书记强调,人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。因此,能否抓住我国人工智能发展带来的历史性机遇,乘胜加快推进产业结构转型
学位
多式联运是一种高效率、现代化的运输组织模式,可以充分发挥各种运输方式的组合优势,实现资源的高效整合和运输的无缝衔接。公铁联运是内陆集装箱多式联运的主要组成部分,具有运量大、成本低、安全性高和低碳环保等特点。但目前我国公铁联运发展较缓,货物主要通过公路运输,铁路运输占比较小,其中运价是制约公铁联运发展的重要因素之一。因此,研究集装箱陆港多式联运定价策略,对改变中国不合理的运输结构,引导集装箱公路直运
学位
为解决能源大数据中心多源异构数据质量评估难的问题,提出一种基于交叉域分析的能源大数据中心数据质量评估方法。首先,通过主成分分析法提取能源大数据中心的电、水、煤、气、油等数据;其次,通过模糊均值聚类方法对各类能源数据进行聚类,形成能源典型数据特征,并建立数据特征评估指标集;最后,通过能源数据交叉域分析来评估能源大数据中心数据质量。应用所提方法评估某市能源大数据中心的数据质量,评估准确率达99.32%
期刊
城市经济的快速发展及空间范围的不断拓展,城镇化水平的不断提升,导致居民出行的需求更加旺盛,交通拥堵、城市污染等问题随之而来。轨道交通具有运量大、速度快、效率高等特点,是解决城市交通问题的首要选择。然而,在轨道交通的发展过程中,暴露出诸多问题,如:轨道交通与沿线土地发展不匹配、城市交通供需不平衡、轨道交通客流的潮汐效应等问题。因此,对城市轨道交通协调关系进行研究,分析轨道交通系统、土地利用与轨道交通
学位
我国港口已步入从规模速度型向质量效益型转变的关键时期,推动区域港口群协同发展,加强港口建设和优化港口资源配置,是提升港口群整体竞争力的关键。粤港澳大湾区港口系统是我国重要沿海港口群之一,拥有深圳、广州和香港港三大世界级集装箱港口,港口同质化竞争激烈。为更好支撑粤港澳大湾区建设,需明确粤港澳大湾区港口系统竞争力提升的发展方向与着力点。本文首先采用集中度比率、赫芬达尔-赫希曼指数以及动态偏离-份额分析
学位