论文部分内容阅读
随着计算机仿真技术和高精度传感仪器的发展,科学研究各领域的数据量呈现爆炸式增长。与此同时,数据类型多样化和处理速度难以匹配生产速度等问题也对科学数据管理提出了挑战。传统的以文件为中心的科学数据管理方式逐渐难以满足互联网环境下数据分享、查询和分析等应用的需求。在这种背景下,“以数据库为中心”的数据管理方式由于在很多方面表现出巨大优势而开始被广泛地接受。但是由于当前数据管理模型类型很多,而且不同应用的数据特征和需求差异巨大,数据管理模型的选择成为了科学数据应用面临的难题。 本文提出了科学大数据管理模型的决策方法——MFP层次决策法,该方法将复杂的模型选择问题划分为三个主要层次,从数据模型(Model)、功能需求(Function)和性能要求(Performance)对应用进行了定义。在每个层次下,可以根据应用的具体特点提出不同的决策条件,利用这些条件对不同的数据管理模型进行衡量。为了配合MFP方法的使用,本文提出了一种改进的决策表模型,该模型可以将各层次决策条件的衡量结果展示和计算出来,最终得到一个最优的数据管理模型。另外,本文通过总结和归纳科学数据应用中的典型特征,列举了每个层次下的决策条件,这些决策条件为MFP方法在具体科学数据管理项目的应用提供了参考。 最后,本文通过对一个典型的科学数据应用场景的分析,证实了MFP决策方法的有效性。