论文部分内容阅读
“全天时、全天候”海洋监测立体网的建立,使得海洋数据的量急剧增长,同时不同监测手段的使用,海洋数据的监测频率、数据格式等都存在各异性。目前,海洋数据呈现多样、多维、多时空、多语义、多源等大数据异构特征,这些特征制约了海洋数据的快速、准确的集成,影响了多个异构数据源间高效的共享,降低了涉海相关人员管理数据的效率。因此,高效的数据集成成为海洋数据管理研究的一个热点问题,同时也是海洋领域信息建设化过程中的重要环节。 本文以海洋监测数据为研究对象,综述了国内外数据集成技术研究发展概况,发现模式和语法等异构问题目前已有相当成熟的技术,比如联邦系统、中间件系统和数据仓库系统。而对多源数据的实体同一性,同一概念的二义性等语义级的异构问题的研究相对匮乏。同时,数据的多源性使得实体间的相关性难以体现,因此这种语义级的集成成为影响数据集成的瓶颈问题之一。 针对多源数据集中的语义异构的问题,本文结合海洋数据的多时空、多语义等特性,采用了海洋领域的海洋本体数据集成方法;提出了基于加权综合的海洋本体映射方法;基于本体的多源异构海洋监测数据集成方法,设计并实现了海域环境综合整治与修复数据共享系统。系统的实现也验证了在本文中所提出方法的有效性、合理性和正确性。 本文的主要研究工作包括: 1.论述了相关研究海洋数据集成方面的研究背景和目的意义,介绍和分析了海洋监测数据集成的关键问题所在;分析和阐述了在大数据环境下,多源异构数据的集成对数据高效管理和应用的影响。 2.面向多源异构的海洋监测数据在集成时出现的语义异构问题,本文借鉴本体的理论思想,结合海洋数据的多时空、多语义特性提出海洋本体理论用于解决海洋监测数据间语义异致性问题。 3.基于海洋本体理论,提出多源异构海洋监测数据集成架构,创建海洋本体和建立映射;在映射建立过程中,提出一种加权综合的海洋本体映射方法,基于海洋监测的高维度特征,通过预先剔除不相关的属性进行优化。最后通过实验分析验证,该方法能够提高海洋本体间映射的查全率和查准率。 4.基于本体的多源异构海洋监测数据集成方法,设计实现了海域环境综合整治与修复数据共享与交换系统。该系统通过消除海洋地质、海洋气象、海洋生物、海洋化学、海洋水文、物理等交叉领域多科数据信息的语义冲突问题,为文中的集成方法系统提供支持,验证了该方法的有效性、合理性和正确性。