面向科学数据共享的元数据关键问题研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:jiangcongzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字化技术和网络的发展推动了海量数据的产生、共享与应用,使得科学与工程研究、教育日益成为数据密集型的工作.科学数据已经成为一种重要的战略资源,将在未来全球科技合作与科技竞争中发挥越来越重要的作用.面对这种新的机遇,世界各国和相关的国际组织都在积极推动科学数据的收集、管理、共享与应用,而我国也启动了国家科学数据共享工程.在科学数据共享中,概括了数据内容、背景、结构、内部关系和来源的高质量元数据对于科学数据的管理、注释、共享、集成和应用至关重要.但是,面向科学数据共享的元数据管理与应用也面临着一系列的问题和挑战,如何在现有标准的基础上,发展学科领域元数据标准;如何实现不同元数据标准的共享与互操作;如何支持应用程序对元数据语义的共同理解,实现应用程序之间元数据信息的自动交换以及在此基础上数据自动融合、集成、计算分析;如何提供便捷的工具实现元数据自动获取;等等.本文就是面向科学数据共享的需求针对上述关键问题展开了研究. 本文首先研究了元数据、元数据标准与本体等相关概念的内涵与外延,厘清了这些概念以及它们之间的关系,探讨了元数据语法表示与封装方法、本体构建方法与Web本体语言. 本文将科学数据共享的基本单元抽象为科学数据对象,该对象是由数据、数据模型和描述型元数据封装成一体的具有唯一标识的数字对象.科学数据对象采用开放式、动态的逻辑封装方法,具有自解释性、自治性、动态性和可扩展性.针对科学数据对象的基本性质与特征,以事件为核心,提出了科学数据共享的元数据参考模型SDBMRM.该模型是一个OWL描述的本体,它不仅为科学数据对象的元数据封装提供了语义模型,也为科学数据共享中元数据标准的发展提供了参考模型,还为科学数据共享中元数据互操作提供了公共的、可共享的顶层语义模型. 元数据注册作为科学数据共享中元数据标准的共享与重用、元数据互操作的基础环境与平台,本文提出了一个开放的注册系统框架,明确了注册对象、注册过程、功能框架与数据模型.本文进一步提出了注册系统元数据模型映射与实例转换的两种主要方法:基于规则的整体直接映射法和基于语义的分层间接映射法.整体直接映射法实现任意两个XML Schema表示的元数据模型的映射,以及在此基础上元数据实例的自动转换.为此,本文重点设计了模型映射与实例转换的规则.间接映射法自动分离元数据模型的语法与语义,模型映射分阶段在语法和语义上分别展开.被分离的语义模型映射到元数据参考模型SDBMRM,从而建立元数据语义关系网络semNet,在此基础上实现模型的语义映射.为此,本文重点设计了从元数据模型的XML Schema语法表示中自动提取OWL语义模型的规则,提出了元数据模型XML Schema语法表示的语义注释方法和semNet本体模型,设计了语义映射中的模型组件发现算法.面向关系型数据库基于语义的集成,研究了关系数据库物理模型与本体模型映射方法,设计了描述这种映射关系的语义元数据模型--D2O本体.基于D2O本体描述的语义元数据,应用系统可以自动实现将关系数据库数据实例提升为本体实例,从而实现基于概念的数据集成.本文进一步提出了基于语义元数据的关系型数据库语义集成框架,设计了语义查询分解与转换方法.
其他文献
本文的研究工作包括两部分:《现代汉语语法信息词典》管理平台的设计与开发和地名库建设。 语言知识库作为自然语言处理系统必不可少的组成部分一直受到研究者重视。《现代
随着经济和社会的高速发展,我国城市发展已进入快速增长时期,城市规模不断扩大,人口密集度不断增高,遭受各种突发事件的灾害的威胁形势严峻。一旦突发事件发生,如果不能及时采取有
随着经济的快速发展,企业和政府机构对信息生成、交换、分析的能力要求越来越高,XBRL技术的发展与应用为信息供应链提供了理想的解决方案。现有的XBRL数据存储方式由于数据失真
学位
随着网络技术的发展,分布式系统出现了许多新的计算模式,其中最突出的代表是Web service、Peer-to-Peer计算和网格技术。这些新的计算模式为应用系统提供了几乎无限的计算能力
虚拟存储是现代微处理器系统必不可少的存储模式,它把内存和外存统一起来,呈现给用户一个比实际内存大的多的虚拟存储空间,而且它给不同程序之间的数据和指令提供保护(比如地址
数字版权管理(Digital Rights Management,简称DRM)伴随着近年来不断出现的版权风波问题受到广泛关注,成为一个研究热点。与此同时,多媒体教学音视频作为一类特殊的媒体,由于其公
数据库技术是过去几十年数据管理的主要手段,取得了丰硕的成果。进入二十世纪九十年代后,数据管理面临新的应用需求,首先是数据管理主体的扩展;其次是很多新应用依赖于大量分散的
制造执行系统(MES)是位于企业计划管理层与工业控制层之间的执行层。它将ERP系统的计划管理信息进行分解,将操作指令传递给控制底层。同时MES采集生产现场的数据,经过分析、
股份制及股市的不断健全发展,使得股票投资形成了一项重要的投资活动。股票市场有机遇也有风险,有许多影响股价的因素。如何选择具有升值潜力的股票成为了投资者关注的焦点,
近年来作为解决数字产品版权保护问题的重要手段之一,数字水印技术得到众多不同背景的研究人员的关注。本文针对应用于版权保护的鲁棒数字图像水印技术做了一些研究,主要包括以