论文部分内容阅读
本文以中国大陆1961年-2012年连续52年近800个气象站点的温度场数据为例,探索时空数据建模方法。温度与经度、纬度、海拔三者的相关性表现为经度大于105。E、纬度项、海拔大于2000m时负相关,经度小于105。E或海拔小于2000m时无明显相关。基于三者不同相关程度,构建了两种回归模型。模型工:Z(X,Y,Z)=a1+I1·b1X+c1Y+I2·d1Z+v1(X,Y,Z),Z(X,Y,Z)为温度数据X、Y、Z分别为经度、纬度、海拔,I1和I2为条件函数,v1(X,Y,Z)是误差项。模型Ⅱ:Z(X,Y,Z)=a2+b2·|rX|·X+c2·|rY|·Y+d2·|rZ|·Z+v2)X,Y,Z),rX、rY、rZ分别为温度数据与经度、纬度和海拔的相关系数。模型Ⅱ残差v2与经度、纬度、海拔三者的相关系数均为0;模型工残差v1与经度、海拔变为低度相关,与纬度无相关。模型 Ⅱ残差v2的标准差、稳健标准差均小于模型工;模型工残差v1标准差(s1)的范围是3.1-3.3℃,V1稳健标准差(r1)的范围是2.9-3.1℃v2残差标准差(s2)的范围是2.5-2.9℃,v2稳健标准差(r2)的范围是2.3-2.6℃。同模型工残差v1相比,模型Ⅱ残差v2在交叉验证大多数指标上都有更高的精度。两种模型残差均有接近0的平均误差ME,残差v2的RMSE为1.754℃小于残差v1的RNSE2.285℃,残差v2的ASE为1.593℃残差小于v1的ASE2.17℃,残差v2的MSE为0.003℃小于残差v1的MSE0.005℃,残差v2的SEP为1.468℃小于残差v1的SEP1.742℃。基于相关系数的回归模型(模型Ⅱ)比引入条件函数的多元线性回归模型(模型工)有更高的精度。构建了基于Delaunay三角网自然邻域的空间粗差探测方法,能有效用于对中国大陆温度场数据粗差的探测。采用相关分析方法,发现了中国大陆温度场具有乘性扰动特征。其中96.27%的测站其均值与标准差、稳健标准差相关性符合负相关趋势,仅有3.73%的测站符合正相关趋势,这正相关的27个测站大多分布在四川盆地,海拔500m以下的测站占77.78%。