论文部分内容阅读
随着高性能计算的飞速发展,大规模的科学数据随之产生,为如何有效地分析大规模数据提出了新的挑战。可视化作为分析、探索大规模数据的重要方法,旨在通过将数据映射为各种图形元素,更直观地展示数据,帮助用户分析数据中蕴含的不易发掘的有价值信息。向量场可视化在分析向量场数据中扮演着重要的角色,能够帮助研究者探索向量场中难于理解的复杂的物理现象、规律等。在数据获取、使用过程中,不可避免地会引入不确定性,不确定性已成为数据的重要组成部分,在分析数据过程中,可视化数据中的不确定性能够帮助研究者更全面地认识数据,并做出合理的决策。目前向量场不确定性可视化得到越来越多研究者的关注。通过生成集合模拟向量场数据并可视化其中不确定性能够向领域专家展示集合向量场数据的整体情况及成员间的差异,帮助领域专家更科学地分析各种科学现象。针对集合向量场数据,本文提出一种新的集合成员间运动差异度量方法并可视化集合向量场的不确定性。主要的研究内容为:首先,为了衡量不同长度迹线间的差异并避免噪声对差异结果的影响,提出基于EDR(实数序列编辑距离)的迹线间距离度量方法。相比于传统距离度量方法,该方法具有更高的准确度;同时,基于空间邻域结构相关性,提出了集合向量场运动不确定性综合度量方法EPEDR,全面考虑了向量场中网格点及其邻域在不同集合成员中的运动差异,并有效结合两种差异;其次,为了揭示向量场不同网格点运动不确定性,改进了Canopy-Kmeans聚类算法用于集合迹线聚类,聚类的结果能够帮助领域专家清晰地识别并分析不同的运动模式;最后,为了探索一个网格点的不同运动模式内迹线运动的发散程度,设计了一个shuttlecock图标用来可视化展示不同运动模式内的细节信息,并比较不同网格点的运动差异。本文在Double Gyre合成数据集、ECMWF数据集及Isabel Hurricane数据集进行实验验证,并对比Euclidean distance、DTW、LCSS方法对集合向量场运动不确定性可视化结果,结果证明本文方法EPEDR相比其他方法能够更加准确、有效地度量集合向量场的不确定性。