论文部分内容阅读
随着科学技术的进步与发展,海洋探测技术不断改善、优化,为海洋科学的研究、海洋工程的建设提供了有力的数据支持。同时,由于海洋数据的大数据化、复杂性、多样化等特征,给数据的管理、利用以及海洋知识的挖掘带来了前所未有的挑战。论文基于南海北部区域1972-2011年共40年的海洋动力环境数据,研究了数据存储和统计分析相关内容。论文中使用的40年长期海浪、海流、气象等海洋动力环境数据集,是根据波浪、海流、海面风等典型海洋现象的具体特点和形成机制,采用数据同化的方法将多源观测数据同化进入数值模式中产生再分析构建的。其中,风场数据是采用数值模式WRF及同化技术模拟得到,并以此为海面强迫场,利用WW III海浪模式模拟得到海浪场,利用有限体积三维全动力海流模型FVCOM模式构建海流场。模拟得到的海洋数据,以年为单位分别存储于NetCDF文件中。关于海洋动力环境数据的存储问题,由于传统的文件存储方案有诸多弊端,论文提出了一种基于分布式数据库的云存储管理方案。该方案是采用MyCat中间件和MYSQL数据库平台进行搭建,设计了符合海洋动力环境数据应用的水平分片与垂直分片相结合的混合分片方案,在一定程度上提高了数据的读取效率。为了进一步优化云存储的管理方案,论文在分片方案的基础上提出了时空索引方案,大大缩短了系统响应时间。关于海洋动力环境数据的统计分析问题,论文通过截断值统计和散布图统计两种方法实现。截断值统计是在海洋动力环境要素数据统计图交互式绘制的基础上实现的,进行了波候特征分析、极端风暴数据提取与分析、台风浪特征分析的方法研究;散布图统计利用传统定义实现了波浪-周期联合分布统计,并分别利用分布I型极值函数和Ochi提出的波高周期联合分布函数相关理论估计了不同重现期极值及对应的周期期望值;散布图统计利用三维的散布图,论文定义为散布体,统计并分析了波浪能有效时间。