论文部分内容阅读
数字海洋是由海洋立体监测数据及其分析算法与数据模型构建而成的虚拟海洋世界,是对海洋的数字化重现。数字海洋的建设和发展给海洋相关各种综合管理与公益服务带来了数字化革命。基于海洋海量复杂数据,运用现代信息技术形成高效开放的数据集成平台及其管理体系则是建立数字海洋的核心任务之一。海洋数据因其数据源各不相同,其获取、处理以及传播方式千差万别,产生了多源异构的特点。如何解决海洋数据管理中由于数据多源异构的复杂性带来的种种问题,对深化数字海洋数据平台建设,实现海洋数据的多维采集、高效处理以及有效共享有着重要的现实意义。 本文基于海洋数据的自身特点,对数字海洋的海量多源异构数据集成管理进行优化研究,提升了海洋异构数据交换和映射效率,增强了多源不确定数据的表述能力,优化了海洋异构数据的数据集成,对数字海洋多源异构数据管理有着重要的指导意义。 本文的主要工作及研究成果如下: (1)数字海洋多源异构数据的元数据标准框架优化 通过分析海洋数据特征,给出数字海洋元数据标准的功能、范围、框架约束,形成了海洋元数据标准的设计约束;根据海洋数据和元数据的生命周期特性和在生命周期范围中作用域变化,提出了基于生命周期的海洋元数据标准框架、分类定义及其功能合集,并且给出了基于该元数据框架应用的海洋异构数据交换和整合适配方法。 (2)海洋异构数据交换自动化模型研究与自动模式映射效率优化 提出了数字海洋异构数据交换的自动化模型和该模型的XML描述,并基于该模型深入分析了海洋异构数据映射关系管理机制;结合海洋数据特性,在海洋异构数据自动映射机器学习中提出了基于概率和权重的样本过滤机制;为了更准确的评估模式映射机器学习中的学习输出指标,给出了多分析器模型的概念和模型结构,进而引入了模糊综合评判形成多分析器输出的综合评判量化其分析结果。实验表明样本过滤机制和多分析器模型能够明显提高海洋异构数据模式映射机器学习的效率。 (3)海洋多源异构不确定数据融合管理优化与复杂事件概率模型研究 为解决海洋数据多源性和不确定性并存导致的融合异构冲突,分别从融合层次、融合冲突、融合过程三个方面对多源不确定数据进行了数据融合管理优化研究;提出了关联事件有向图的概率数据模型和多维概率模型空间的概念,并把XML概率节点引申到多维空间,进而定义了多维空间的降维和查询操作方式。实验表明关联事件有向图的概率模型和多维概率模型能够有效优化海洋半结构不确定数据的查询性能。 (4)海洋异构数据集成管理关键技术优化与系统设计 在海洋数据应用系统-风暴潮辅助决策信息集成系统的设计中提出了可级联虚拟海洋数据引擎结构,简化了异构数据集成的系统复杂度;给出了数据无缝集成的层次模型,用以优化海洋异构数据的集成管理;通过采用二次随机回答序列替换算法(SRRCR)的海洋异构数据随机化扰乱保护方法,对海洋异构数据集成过程中的敏感信息进行了数据保护优化。 本论文的主要创新点有: (1)根据海洋多源异构数据特征,提出多分析器机器学习模型并引入模糊综合评判对分析输出的多维复杂因素量化,得出准确多种因素制约的分析结果,形成针对海洋异构数据交换和映射的优化,解决了海洋映射数据的模糊性和多态性问题,显著的提升了海洋数据模式映射机器学习的效率。 (2)提出了关联事件有向图概率模型,兼顾了海洋数据周边事件以及外部驱动事件的概率影响,为跟踪半结构化数据演变过程中的不确定性提供有效的概率模型支撑;进而给出海洋多源不确定数据多维概率模型的概念和多维查询的定义,形成统一的半结构化海洋数据不确定性表述,并优化了概率操作的效率。 (3)在海洋多源异构数据的集成管理中,提出了数据可级联虚拟引擎技术,通过多层级联方式实现组件功能分治技术,实现各自数据接口的独立互操作,从而提高了异构数据集成系统的可扩充性;提出二次随机化回答列替换算法,引入可调节因子和空值保护,从而实现了在海洋异构数据集成中的信息源作为信息宿主的有效数据保护。