论文部分内容阅读
摘要降雨在时间和空间中的每次大小及落区均具有一定随机性,且降雨量也是一类下界大于0而上界不确定的随机事件,假设降雨量的随机变化服从L分布,并将其标准化处理,结果表明,自相对干湿标准化指数的最大正振幅为1,最大负振幅为-1,平衡点位置为0;指数小(大)于0时则表明气候偏干燥(湿润),该干湿振荡系统均方差为1/3;在平衡点两侧的-1/3~0和0~1/3范围内,标准化降雨量的出现概率均是35%,而在-1/3~1/3的发生总概率是70%,表明在该区间干与湿接近准平衡;在-1/3~-2/3和1/3~2/3间,降雨量的随机出现概率均是12%,这时负(正)区间表示中等干燥(中等湿润);而在-2/3~-1和2/3~1间,变量随机出现概率均是3%,此时负(正)区间代表严重或超级干燥(严重或超级湿润),这2个区间也是显著性检验区间。降雨量标准化对原降雨量在湿润区间的偏态分布具有右侧收尾效应,最终使以均值为参照点的向右偏态分布演变成以0点为参照点的对称分布;此时可将干湿振荡系统划分成自相对干湿6级或自相对干湿12级。该研究中的标准化干旱指数(X-XA)/XA与目前台站正在使用的降水距平百分率在原理及计算形式上均十分一致,其划分结果和所对应的干湿区间也比较接近,所以理论上可认为降水距平百分率(标准化干旱指数)基本上是适用于偏态分布的。
关键词降水距平百分率;标准化干旱指数;向右偏态分布;L分布函数;自相对干湿;右侧收尾效应
中图分类号O211.3;S161.3文献标识码A文章编号0517-6611(2015)28-173-06
L Probability Distribution Function and One SelfComparison Theoretical Standard of Dry and Wet Index
WANG Wanli1,2,3, LIU Yaolin1, CAI Shuming1 et al
(1. China Meteorological Administration, Wuhan Regional Climate Centre, Wuhan, Hubei 430074; 2. School of Resource and Environmental Science of Wuhan University, Wuhan, Hubei 430079; 3. College of Earth Science, Yunnan University, Kunming, Yunnan 650091)
AbstractThere are phenomena that different amplitude and various anomaly of almost all stochastic variable is around of their the average value in time and space, to quantify and grade those various temporal and spatial anomaly is a necessaries required for scientific and objective studying those various anomaly, rainfall is a random temporal and spatial variable, but rainfall is also one kind of nonnegative variable that its minimum is zero and its maximum is not certain. L Probability Distribution Function is new probability distribution discovered that its maximum amplitude of oscillation system is unique parameter and using maximum amplitude of oscillation it is portrayed that what occurring probability and how distribution is for the randomvibration system at symmetrically adjacent to the balance point. After rainfall becomes standardized variable the results show that the positive (negative) of maximum amplitude of the vibration system of the dry and humid indices standardized is +1(-1); zero is the balance point between dry and wet; “climate” is described as dry (wet) when standardized variable is less (more) than zero; the standard deviation (SD) of L Probability Distribution Standardized is 1/3; the probability is 35%, respectively ,in interval (0~±1/3)at two sides around the balance point(zero); however, the total probability is 70% in the interval(-1/3~+1/3)in which is recognized as QuasiBalance State between dry and wet; the probability is 12%, respectively, in interval ±(1/3~2/3); thus, positive interval (+1/3~+2/3)means moderate wet; negative interval (-1/3~-2/3) means moderate drought; similarly, the probability is 3%, respectively, in interval ±(2/3~3/3); therefore, positive interval(+2/3~+3/3)means super(serious) wet; negative interval(-2/3~-3/3)indicates super(severe) drought; this the interval±(2/3~3/3)are also used to test level of significance. Meanwhile, the process of standardized rainfall variable puts function (action) of normal distribution on Skewness Distribution of rainfall variable; this is called as effect of “drawing back right tail”(the tail on the right side of mean); then, by the process of standardized rainfall variable the Skewness Distribution of rainfall variable with the balance point of average value is changed into the normal (symmetry) distribution of standardized rainfall variable with the new balance point of zero; finally, by means of L Standardized Probability Distribution Function the dry and wet oscillation system is classified into 6 levels or 12 levels for the extent of their humid or dry depart from their the average values. In addition, Standardized dry index (X-XA)/XA is strikingly same as contemporary Precipitation Anomaly Percentage in aspect of principle and mathematical expressions, even in results, so Precipitation Anomaly Percentage is supported by conclusion of this paper for controvert of whether or not Precipitation Anomaly Percentage is suitable to the Skewness Distribution of rainfall variable, the results of this paper verify that Precipitation Anomaly Percentage of L Standardized Probability Distribution Function is applicable to the Skewness Distribution of rainfall variable. Key wordsPrecipitation anomaly percentage; Standardized dry index; Right skewness distribution; L distribution function; Self relative wet and dry; Effect of drawing back right tail
降雨量在时间和空间上具有分布不均匀之性质,但针对某个特定时段和某个特定空间可以求出不同的时间和空间平均值,求出均值后,把时间上、空间上每个点位的降雨量集合,这样就构成降雨量的时间和空间(集)系列,它们与各自平均值之间也就形成一个围绕其均值的波动(振荡)自然现象,同时也就存在相对各自均值的干湿程度差异,即自相对干湿问题。具体而言,在时间方面产生某些地区在某个历史时期为干旱(偏干)、某个时期为洪涝(偏湿)的客观事实,如一个地区某个时段相对自身30年平均降水量是偏干或偏湿,这就是一个在时间方面的自相对干湿问题。同时在空间方面,也会产生某些地区偏干、某些地方偏湿的气候差异,这样进一步形成围绕其区域降雨平均值的空间波动情况,如在我国西北偏干、东南偏湿,全国存在一个年降雨量平均值,那么西北干到什么程度、东南湿到什么程度,围绕全国均值,即根据它们偏离均值的程度也可划分干湿等级,最后也就形成了它们相对自身均值的各种不同的干湿分布状况,实质上这就是一个空间上的自相对干湿问题。但现在的问题是降雨量这一变量在自身时空变化过程中,除了现在已存在并正在使用的等级划分外,这种变化幅度能否用其他分布函数和其他方法客观量化,具体来说能否用其他等级的形式对这种振幅变化进行刻画,这方面已有人做过这类工作,可能有的在理论上已有了相当大影响[1-4],有的在台站现实业务中也正在使用[5-8]。
L分布函数作为一类能较好描述自然振荡系统和对称振荡系统偏离它们自身平衡位置概率大小的新的有力工具,是一类能用振荡最大振幅来度量系统在某一区间出现概率大小的特殊概率分布函数。有关L分布函数在干湿方面的应用,笔者已做过一些工作,如在《L分布函数与相对干湿的一种理论标准》[9]中,讨论了降水蒸发差(P-E)这一特殊变量的概率分布情况,即“集水盆”的相对干湿问题,或称作“环境”相对干湿问题,这是一类特定环境下的水分“补充与需求之差”的等级问题。但在此即将展开的研究是另外一类时间系列变量或空间集变量,相对它们各自时间均值和空间均值的相对干湿问题,也就是说自变量的时间变化和空间变化的变化等级问题,即降雨量变量在时空上的自相对干湿问题,有的地方也称时空振幅离差(距平)等级问题。
1随机降水量分布的偏态性质
用X表示时间系列和空间系列中不同点的降水量大小,而均值一般情况下可以简单写成:
对离散型
XA=(ni=1Xi)/n(1)
对于连续型
XA=∫∞-∞f(X)dX(2)
这里(2)式中f(X)是概率密度函数。此时,距平=X-XA(0≤X≤某一较大正数)。这里XA 代表随机降雨量的时间空间系列平均值。那么此时存在X=XA、X>XA、X X=XA,干湿振荡系统处于平衡态,变量等于均值;X>XA,干湿振荡系统处于偏湿态,变量大于均值;X 0 ≤X < 某一较大正数,
但均值XA 却是某个大于零的正数。显然X 围绕它的均值XA或在它均值两侧是不对称分布的(图1)。
注:图中Xm是降水量变量取最小时的值,这里 Xm=0;XM 是降水量变量取最大值时的值(不确定)。
图1降水量X在其时间空间均值两侧不对称(偏态)分布示意图
2降水量距平变量振荡分析
这里引入降雨量距平变量V:
V=X-XA(3)
下面分析降水量变量与降水量距平变量之间的关系:
当X=0,有V=-XA,此时V用Vm代表;
当X=XA,有V=0;
当X=XM,有V=XM-XA,此时V用VM代表。
由于0≤X≤XM,则-XA=Vm≤V 图2降水量距平变量V在其时间空间均值0点两侧不对称(偏态)分布示意图
3原始L概率密度分布函数0-1简化
下式是L分布函数的原始标准形式,其中θM是最大振幅,θ是自变量。
f(θ)=14θMln(θMθ)2(-θM≤θ≤θM)(4)
设新变量
w=θθM(5)
构成
f(w)=14wMln(wMw)2(-1≤w≤1)(6)
即当旧变量θ=θM时,w=wM=θMθM=1(7)
将wM=1,代入(6)式中有
f(w)=14ln(1w)2(-1≤w=θθM≤1)(8)
将新变量w=θθM代入,并还原有
f(θθM)=14ln(1θθM)2(-1≤θθM≤1)(9)
这就是L概率密度分布函数的0-1形式。0-1变量等于原变量与原最大变幅的比值。
4假设降水量距平变量振荡服从L概率分布函数 由于假设降水量距平变量V是服从L概率分布函数的,那么有
f(V)=14VMln(VMV)2(-XA=Vm≤V 根据L概率密度分布函数的0-1形式第(9)式,(10)式可转化为:
f(VVM)=14ln(1VVM)2(-1≤VVM≤1)(11)
将降水量距平变量V=X-XA代入上式有
f(X-XAVM)=14ln(1X-XAVM)2
(0≤X≤XM)或(-1≤X-XAVM≤1)(12)
根据概率密度函数的边界条件
f(-1)=0、 f(1)=0(13)
将式(12)中的变量活动区间0≤X 43卷28期王万里等L分布函数和自相对干湿等级标准
在第一区间(0≤X≤XA),
要使标准化变量X-XAVM=-1,此时只有VM=XA,所以在第一区间(0≤X≤XA)的标准化 L概率密度函数变量变成
XS=X-XAXA
XS代表标准化变量。 即
f(XS)=f(X-XAXA)=14ln(1X-XAXA)2(0≤X≤XA)(14)
值得注意是当X=XA,上式用洛比达法则[10-11]可证明上式存在(证明略)。
在第二区间(XA≤X≤XM),
要使标准化变量X-XAVM=1,此时必须有VM=X,因为
X-XAX=1-limX→XMXAX=1-XAXM=1-limXM→∞XAXM=1-0=1(15)
在(15)式中,由于降雨量是大于或等于均值的正数,当它大于均值时,就要求它的变化上限在数量上大大超过均值,所以理论上(15)式要取极限。当然从理论上说要求最大降水量趋于无穷,不过现实中无论时间系列或空间系列降水最大值都不可能趋于无穷,但当最大降水量显著大于自身均值很多倍(XMXA)时,就可以认定上式第二项很小到大小可以忽略不计的程度,此时(15)式成立,如亚洲最大年降水量在印度东北部和孟加拉湾北部的乞拉朋齐(Cherrapunji),年降水量可达11 000 mm,亚洲陆面年均降水700 mm左右,两者比值约006,也接近0,所以以上假设在物理实际中是可以接受的。因此,在第二区间(XA≤X≤XM)的标准化 L概率密度函数变成
f(XS)=f(X-XAX)=14ln(1X-XAX)2(XA≤X≤XM)(16)
理论上上式存在的要求是XMXA。这样在第二区间(XA≤X≤XM),标准化 L概率密度函数变量变成
XS=X-XAX(17)
XS代表标准化变量。
最后有2个区间的标准化 L概率密度函数:
f(XS)=f(X-XAXA)=14ln(1X-XAXA)2(-1≤X-XAXA≤0)(18)
f(XS)=f(X-XAX)=14ln(1X-XAX)2(0≤X-XAX≤1)(19)
(18)式是针对偏干燥区间的,因为此区间要求XXA,降雨量大于自身均值(图3)。
降雨量作为一个大于零小于某个较大正数的特殊正变量,它在0与均值间应该很集中,大于均值后的变化范围应
该是较大的,这点决定了它大于均值后的分布有长尾现象,或说它的分布是右(正)偏态的,但从图3可看出经过标准化处理,降水量的最大正振幅是+1、最大负振幅是-1,以0点为新的平衡点,所以标准化后,降雨量标准化随机变量的分布就近似趋于对称分布,这是由于随机变量的变化造成的,当一个实际变量被某个正数除后,事实上它的变化区间就被缩短了这个被除数的倍数,如降雨量的变化范围是0~100 mm,假设它的加权均值是20 mm,变化范围被均值所除后,变化范围就变成了0~5(无量纲),所以此番处理后,就具有某种“收尾”效果;加之以距平为新变量,就使得以均值为对称点的分布演变成以0值为对称点的分布了,另外在偏干燥区降雨量距平变量是被均值所除,而在偏湿润区间降雨量距平变量是被大于均值的正数所除,甚至有可能会被降雨量最大值所除,显然均值两侧的收缩速度是不一样的,所以在湿润区间(X>XA)的收尾速度显然大于干旱区间。表明某些偏态分布经过L分布函数的边界条件处理后,偏态分布就不再存在了,说明L分布函数和随机变量标准化处理相结合具有纠偏效应,这点在理论上是非常重要的。
5时间空间中自相对干湿问题及标准
周期波动是地球大气运动中最基本的本质属性,当然由大气运动而产生的降雨自然也秉赋这一周期性,所以由不同时期的降水量这一随机量所构成的随机时间系列,自然也会体现出某个时段多雨、某些时段少雨的特性,那么多雨多到什么程度、少雨又少到水平,通常这得与降雨量的历史平均值相比,如气象部门通常以30年平均值为比较基础。同样,就一个特定区域,如亚洲每个国家、每个地区,甚至每个城市年降雨量都不同,这样在空间里也构成一降雨量空间集,同样也需要计算出一个空间平均值,如亚洲年降雨量的空间平均值就约多于700 mm,通常大于均值可认为在亚洲气候为偏湿润,小于均值可认为在亚洲气候为偏干燥,就常识可以这样处理,但作为专业而言,一个地区的气候干燥到什么程度、一个地区的气候湿润到什么水平,这就需要从理论上进行分级,制定出标准。笔者在此利用随机变量发生概(几)率的大小,并以此为依据进行划分,基本思想是:随机变量在其均值附近的几率大于远离均值的几(概)率,同时“随机标准化降雨量”处在均值附近就表明该时段或该地区气候的干湿接近平衡,或叫气候不干也不湿,这是个大概率事件,而“随机标准化降雨量”很远离均值就是小概率事件,如小于均值并很大程度上同时远离均值,则就是小概率极端干旱事件,反之,大于均值并在很大程度上远离均值,则就是小概率极端湿润(洪涝)事件。 “标准化降雨量”在任意区间概率:
当-1≤X-XAXA≤0(0≤X≤XA),在偏干燥区间中有
P(XS1 =14X2-XAXAln1X2-XAXA2+2X2-XAXA-
X1-XAXA
ln1X1-XAXA2+2X1-XAXA
( 20 )
当0≤X-XAX≤1(XA≤X≤XM),在偏湿润区间中有
P(XS1 =14X2-XAX2ln1X2-XAX22+2X2-XAX2-
X1-XAX1
ln1X1-XAX12+2X1-XAX1
(21)
通过(20)、(21)式计算,在1倍均方根、2倍均方根、3倍均方根范围内的概率分别为:
P(-1/3 P(-2/3 P(-1 在以自相对标准化降雨量为自变量的L分布的概率密度函数(图3a)中,左侧0~-1的范围内是自相对“干旱区间”,显然在自相对“干旱区间”愈靠近0点干旱程度愈微弱,相反愈靠近-1点自相对干旱程度愈强烈;同理,右侧0~1的范围内,是自相对“湿润区间”,在“湿润区间”愈靠近0点自相对湿润程度愈弱,愈靠近+1点自相对湿润程度愈强烈。由于区间(-1/3 为证明换算过程,这里以表1从右数第4栏中的第2行换算为例:
已知 ∞>X-XAXA>23,求XAX
从上式可得
∞>XXA-1>23
不等号两侧同时加1后有
∞>XXA>53
分子分母对调位置
0 第4栏的其余行以及其他栏的换算方法类似,这里不再一一赘述。
另外在表1的基础上,对每个区间又等分,如对0.33~
0、1/3~0、2/6~0等分后变成2个对等区间:2/6~1/6、1/6~0那么6个等级就将变成12个等级(表2)。并用L分布计算出相应的区间概率大小列入表2从右数第1栏。
将表2中从右数的第6栏即标准化干旱指数(X-XA)/XA与台站现行使用的降水距平百分率(表3)的大小相比较,发现表2中的“微干旱﹑微湿润﹑轻度干旱﹑轻度湿润”这4栏的降水百分率为-33%~33%,刚好在一个正负L分布函数的均方差之间,与表3中现行标准的“正常”(4级)的±25%接近,此处应强调由于L分布比正态分布在均值附近更集中,所以一个正负均方差区间的代表性更好,这样-33%~33%被划分为正常区间更为合理。而表2中在正负一个L分布函数的均方差与2个均方差之间(-33%~-67%、33%~67%),即表2中的“中等偏弱湿润和中等偏强湿润,中等偏弱干旱和中等偏强干旱”等级与表3中的轻涝轻旱接近;而表2中的严重湿润和严重干旱与表3中的中旱中涝接近;最后,表2中的超级干旱或超级湿润与表3中的重旱和重涝接近。这里值得指出的是,当然作为一个新的创新方法,表2中的自相对干湿等级无疑是需要进一步验证的,以期与自然实际更加接近,并以满足实际工作需要,但作为一个新的创新所制定的干湿等级理论和方法,首先在理论上进行一些基础性的讨论是完全必要的,同时也不可否认即便是现在正在使用的标准,由于我国地大辽阔、气候地区差异大,每地都有其一定的特殊性,现在正在使用的标准在各地应用情况也不完全一样,有些地区甚至对国家降水距平百分率所划分的干旱标准还要根据当地的具体情况做出一定的修正,所以就这点来说,从新的理论、不同的理论角度,探索不同的干湿理论标准意义重大,特别是当今在全球气候变暖大背景下更有其特殊的意义,至少来说可以作为现有(正在使用)标准和一些特殊地区气候的参考干湿标准也是可行的,甚至仅作为理论来讨论,这也不失一般意义下的创新实践。
正均方根点(1/3)和负均方根点(-1/3)是L分布0-1标准函数中2个最重要的关键点,它们是L分布性质产生质变的关键分界点,两点之间的区间是该分布的主体或主流,其发生概率高达70%,而两点之外,分布就渐渐过渡到小概率落区,至少可以定义成非主体或非主流。所以分析这两点的性质是有意义的,具体详见表4。
6小结与讨论
就气象干旱而言一般应有两类,一是半永久性干旱,如非洲的撒哈拉沙漠;二是气候波动性的阶段式干旱,如云南省2012和2013年冬春连旱;前者的空间属性较大,后者的时间属性较大,所以该研究对“时空自相对干湿”分析事实上是涵盖了这两类干旱。另外应该强调表1~2的自相对干湿标准比较适合在均值附近比较集中的降雨量时空随机变量,原
因有二方面:①L分布函数在一个正负均方差之间的发生概率是70%,而正态分布在一个正负均方差之间的发生概率仅是68%,另外,L分布函数的峰度系数是0.24,而正态分布的峰度系数是0,说明L分布函数在均值附近更为集中,从而决定了L分布函数对处理在均值附近较为集中的随机变量比正态分布更为合适;②对L分布函数中的随机自变量在引入标准化时空自变量后,就发现标准化时空自变量在干湿区间由于概率分布密度函数的边界条件不同,就产生了被除数的不同,即干区间和湿区间收尾速度不一致的问题,显然湿区间的收尾是快的,这保证了降雨量由下界大于0上界不确定的右偏态性质向以0点为平衡点的对称态转变,其实,标准化时空自变量的分母有点类似于“尺度参数”,而均值有点类似于“位置参数”,所以从该研究的实践来看,不能低估类似L分布函数等对称性分布函数(如正态分布),在处理类似降雨量等右偏态变化及等级的能力,右偏态问题用L分布函数处理是合适的,因为L分布函数自变量是在正负最大振幅间活动,即自变量是有界的,且在最大正负振幅这两点的L分布概率密度大小正好为0,所以,利用这个重要的边界条件,就决定出标准化时空自变量存在两类分母(尺度参数),从而决定了干区间和湿区间收缩速度不一样,湿区间收尾速度明显快于干区间的收尾速度,即右侧收缩快于左侧,而这一点正是L分布优越于正态分布的地方,因为正态分布两侧是无界的,用自变量趋于正负∞,决定不出标准化时空自变量的分母,事实上正态分布的尺度参数(分母)刚好是它的均方根,一旦固定这就是一个不变常数,所以用正态分布处理降水距平百分率 时,两侧收缩速度就会一致,这点也正是有些学者质疑正态分布在处理偏态降雨量的不恰当之处,即降水距平百分率的理论基础不牢固的关键所在,即认为降水量分布是右(正)偏态的,而降水距平百分率却是从正态分布推出来的。但从该研究的实践来看尽管L分布函数和正态分布函数都是对称性分布,但L分布函数自变量两端有界,这是一个非常重要的性质,它可作为一个非常重要的边界条件来利用,从而使标准化变量在湿润区和干旱区产生2个不同的分母,这就决定了湿润区间收尾速度快于干旱区,使其右偏态能向对称态转变(纠偏效应),从而解决降雨量右(正)偏态分布的问题,最后为目前台站正在使用的降水距平百分率
(干旱指数)提供了基础理论方面的支持,即降水距平百分率
的理论基础是可信的。总之,应强调正态分布由于自变量在两端取值无界,所以在决定标准化变量的分母时就没有L分布那样方便有力。
在使用表2时应注意,虽然标准化湿润指数(X-XA)/X和标准化干旱指数(X-XA)/XA 所划分干湿等级的区间基本一致,但物理含义是不同的,如在湿润区间当标准化湿润指数(X-XA)/X等于标准化干旱指数(X-XA)/XA时,虽然两指数的分子形式完全一样,但标准化湿润指数的分子明显大于标准化干旱指数的分子,即标准化湿润指数所描述的降水量大于历史均值的程度明显大于标准化干旱指数所描述的降水量大于历史均值的程度,如当标准化湿润指数(X-XA)/X和标准化干旱指数(X-XA)/XA 均等于L分布的一个均方差1/3时,计算得出标准化湿润指数(X-XA)/X所对应的距平大小是标准化干旱指数(X-XA)/XA所对应的距平大小的1.5倍。说明从理论严谨的角度,在湿润区只能用标准化湿润指数(X-XA)/X,即指数的分母必须是降水量X,而在干旱区只能用标准化干旱指数(X-XA)/XA,即指数的分母必须是历史降水量均值XA,这样,降水距平百分率的变化空间便是从-100%变到100%。对于降水距平百分率,在湿润区间(X>XA)降水距平百分率的分母一定要把历史均值换成降水量,只有在这一条件下,目前气象台站正在使用的降水距平百分率才能从-100%变化到100%,显然此时的降水距平百分率就类似正态形状,并对称于0点,所划分的干湿物理意义也更加明确,也具有将降水量从偏态分布向正态分布的转变,所以降水距平百分率只要在干湿两区间对分母区别对待,理论上便是可行合理的。最后,由于篇幅限制未深入进行个例或同类方法的比较研究,其理论特点或优越性待另文再作评估或待实践中去检验。
参考文献
[1] 张强,鞠笑生,李淑华.三种干旱指标的比较和新指标的确定[J].气象科技,1998(2):48-52.
[2] 任福民,史久恩.我国干旱半干旱区降水的特征分析[J].应用气象学报,1995(4):501-504.
[3] 叶天舒,钱忠华,余景华,等.三种干旱指数在云南省的适用性分析[J].扬州大学学报(自然科学版),2013,16(3):41-46.
[4] 马柱国,符淙斌.中国北方干旱区地表湿润状态的趋势分析[J].气象学报,2001,59(6):737-746.
[5] 王劲松,郭江勇,周跃武,等.干旱指标研究的进展与展望[J].干旱区地理,2007(1):60-65.
[6] 毛飞,孙涵,杨红龙.干湿气候区划研究进展[J].地理科学进展,2011,30(1):17-26.
[7] WILLMOTT C,FEDDEMA J J.气候干湿指数的改进[J].干旱区地理,1993,16(3):90-92.
[8] 国家标准化管理委员会.中华人民共和国国家标准:干旱气候等级(征求意见稿)[A].2010-02-18.
[9] 王万里,谢应齐.L分布函数与相对干湿的一种理论标准[J].安徽农业科学,2014(21):7145-7148.
[10] 王万里,刘耀林,蔡述明,等.L分布函数在“0.6测量法”中的应用[C]//中国环境科学学会.2010年中国环境科学学会学术年会论文集(第四集).北京:中国环境科学出版社,2010.
[11] 王万里,王卫国.大气地转静力平衡的方差分析与L分布[J].云南大学学报(自然科学版),2006,28(5):418-424.
关键词降水距平百分率;标准化干旱指数;向右偏态分布;L分布函数;自相对干湿;右侧收尾效应
中图分类号O211.3;S161.3文献标识码A文章编号0517-6611(2015)28-173-06
L Probability Distribution Function and One SelfComparison Theoretical Standard of Dry and Wet Index
WANG Wanli1,2,3, LIU Yaolin1, CAI Shuming1 et al
(1. China Meteorological Administration, Wuhan Regional Climate Centre, Wuhan, Hubei 430074; 2. School of Resource and Environmental Science of Wuhan University, Wuhan, Hubei 430079; 3. College of Earth Science, Yunnan University, Kunming, Yunnan 650091)
AbstractThere are phenomena that different amplitude and various anomaly of almost all stochastic variable is around of their the average value in time and space, to quantify and grade those various temporal and spatial anomaly is a necessaries required for scientific and objective studying those various anomaly, rainfall is a random temporal and spatial variable, but rainfall is also one kind of nonnegative variable that its minimum is zero and its maximum is not certain. L Probability Distribution Function is new probability distribution discovered that its maximum amplitude of oscillation system is unique parameter and using maximum amplitude of oscillation it is portrayed that what occurring probability and how distribution is for the randomvibration system at symmetrically adjacent to the balance point. After rainfall becomes standardized variable the results show that the positive (negative) of maximum amplitude of the vibration system of the dry and humid indices standardized is +1(-1); zero is the balance point between dry and wet; “climate” is described as dry (wet) when standardized variable is less (more) than zero; the standard deviation (SD) of L Probability Distribution Standardized is 1/3; the probability is 35%, respectively ,in interval (0~±1/3)at two sides around the balance point(zero); however, the total probability is 70% in the interval(-1/3~+1/3)in which is recognized as QuasiBalance State between dry and wet; the probability is 12%, respectively, in interval ±(1/3~2/3); thus, positive interval (+1/3~+2/3)means moderate wet; negative interval (-1/3~-2/3) means moderate drought; similarly, the probability is 3%, respectively, in interval ±(2/3~3/3); therefore, positive interval(+2/3~+3/3)means super(serious) wet; negative interval(-2/3~-3/3)indicates super(severe) drought; this the interval±(2/3~3/3)are also used to test level of significance. Meanwhile, the process of standardized rainfall variable puts function (action) of normal distribution on Skewness Distribution of rainfall variable; this is called as effect of “drawing back right tail”(the tail on the right side of mean); then, by the process of standardized rainfall variable the Skewness Distribution of rainfall variable with the balance point of average value is changed into the normal (symmetry) distribution of standardized rainfall variable with the new balance point of zero; finally, by means of L Standardized Probability Distribution Function the dry and wet oscillation system is classified into 6 levels or 12 levels for the extent of their humid or dry depart from their the average values. In addition, Standardized dry index (X-XA)/XA is strikingly same as contemporary Precipitation Anomaly Percentage in aspect of principle and mathematical expressions, even in results, so Precipitation Anomaly Percentage is supported by conclusion of this paper for controvert of whether or not Precipitation Anomaly Percentage is suitable to the Skewness Distribution of rainfall variable, the results of this paper verify that Precipitation Anomaly Percentage of L Standardized Probability Distribution Function is applicable to the Skewness Distribution of rainfall variable. Key wordsPrecipitation anomaly percentage; Standardized dry index; Right skewness distribution; L distribution function; Self relative wet and dry; Effect of drawing back right tail
降雨量在时间和空间上具有分布不均匀之性质,但针对某个特定时段和某个特定空间可以求出不同的时间和空间平均值,求出均值后,把时间上、空间上每个点位的降雨量集合,这样就构成降雨量的时间和空间(集)系列,它们与各自平均值之间也就形成一个围绕其均值的波动(振荡)自然现象,同时也就存在相对各自均值的干湿程度差异,即自相对干湿问题。具体而言,在时间方面产生某些地区在某个历史时期为干旱(偏干)、某个时期为洪涝(偏湿)的客观事实,如一个地区某个时段相对自身30年平均降水量是偏干或偏湿,这就是一个在时间方面的自相对干湿问题。同时在空间方面,也会产生某些地区偏干、某些地方偏湿的气候差异,这样进一步形成围绕其区域降雨平均值的空间波动情况,如在我国西北偏干、东南偏湿,全国存在一个年降雨量平均值,那么西北干到什么程度、东南湿到什么程度,围绕全国均值,即根据它们偏离均值的程度也可划分干湿等级,最后也就形成了它们相对自身均值的各种不同的干湿分布状况,实质上这就是一个空间上的自相对干湿问题。但现在的问题是降雨量这一变量在自身时空变化过程中,除了现在已存在并正在使用的等级划分外,这种变化幅度能否用其他分布函数和其他方法客观量化,具体来说能否用其他等级的形式对这种振幅变化进行刻画,这方面已有人做过这类工作,可能有的在理论上已有了相当大影响[1-4],有的在台站现实业务中也正在使用[5-8]。
L分布函数作为一类能较好描述自然振荡系统和对称振荡系统偏离它们自身平衡位置概率大小的新的有力工具,是一类能用振荡最大振幅来度量系统在某一区间出现概率大小的特殊概率分布函数。有关L分布函数在干湿方面的应用,笔者已做过一些工作,如在《L分布函数与相对干湿的一种理论标准》[9]中,讨论了降水蒸发差(P-E)这一特殊变量的概率分布情况,即“集水盆”的相对干湿问题,或称作“环境”相对干湿问题,这是一类特定环境下的水分“补充与需求之差”的等级问题。但在此即将展开的研究是另外一类时间系列变量或空间集变量,相对它们各自时间均值和空间均值的相对干湿问题,也就是说自变量的时间变化和空间变化的变化等级问题,即降雨量变量在时空上的自相对干湿问题,有的地方也称时空振幅离差(距平)等级问题。
1随机降水量分布的偏态性质
用X表示时间系列和空间系列中不同点的降水量大小,而均值一般情况下可以简单写成:
对离散型
XA=(ni=1Xi)/n(1)
对于连续型
XA=∫∞-∞f(X)dX(2)
这里(2)式中f(X)是概率密度函数。此时,距平=X-XA(0≤X≤某一较大正数)。这里XA 代表随机降雨量的时间空间系列平均值。那么此时存在X=XA、X>XA、X
但均值XA 却是某个大于零的正数。显然X 围绕它的均值XA或在它均值两侧是不对称分布的(图1)。
注:图中Xm是降水量变量取最小时的值,这里 Xm=0;XM 是降水量变量取最大值时的值(不确定)。
图1降水量X在其时间空间均值两侧不对称(偏态)分布示意图
2降水量距平变量振荡分析
这里引入降雨量距平变量V:
V=X-XA(3)
下面分析降水量变量与降水量距平变量之间的关系:
当X=0,有V=-XA,此时V用Vm代表;
当X=XA,有V=0;
当X=XM,有V=XM-XA,此时V用VM代表。
由于0≤X≤XM,则-XA=Vm≤V
3原始L概率密度分布函数0-1简化
下式是L分布函数的原始标准形式,其中θM是最大振幅,θ是自变量。
f(θ)=14θMln(θMθ)2(-θM≤θ≤θM)(4)
设新变量
w=θθM(5)
构成
f(w)=14wMln(wMw)2(-1≤w≤1)(6)
即当旧变量θ=θM时,w=wM=θMθM=1(7)
将wM=1,代入(6)式中有
f(w)=14ln(1w)2(-1≤w=θθM≤1)(8)
将新变量w=θθM代入,并还原有
f(θθM)=14ln(1θθM)2(-1≤θθM≤1)(9)
这就是L概率密度分布函数的0-1形式。0-1变量等于原变量与原最大变幅的比值。
4假设降水量距平变量振荡服从L概率分布函数 由于假设降水量距平变量V是服从L概率分布函数的,那么有
f(V)=14VMln(VMV)2(-XA=Vm≤V
f(VVM)=14ln(1VVM)2(-1≤VVM≤1)(11)
将降水量距平变量V=X-XA代入上式有
f(X-XAVM)=14ln(1X-XAVM)2
(0≤X≤XM)或(-1≤X-XAVM≤1)(12)
根据概率密度函数的边界条件
f(-1)=0、 f(1)=0(13)
将式(12)中的变量活动区间0≤X
在第一区间(0≤X≤XA),
要使标准化变量X-XAVM=-1,此时只有VM=XA,所以在第一区间(0≤X≤XA)的标准化 L概率密度函数变量变成
XS=X-XAXA
XS代表标准化变量。 即
f(XS)=f(X-XAXA)=14ln(1X-XAXA)2(0≤X≤XA)(14)
值得注意是当X=XA,上式用洛比达法则[10-11]可证明上式存在(证明略)。
在第二区间(XA≤X≤XM),
要使标准化变量X-XAVM=1,此时必须有VM=X,因为
X-XAX=1-limX→XMXAX=1-XAXM=1-limXM→∞XAXM=1-0=1(15)
在(15)式中,由于降雨量是大于或等于均值的正数,当它大于均值时,就要求它的变化上限在数量上大大超过均值,所以理论上(15)式要取极限。当然从理论上说要求最大降水量趋于无穷,不过现实中无论时间系列或空间系列降水最大值都不可能趋于无穷,但当最大降水量显著大于自身均值很多倍(XMXA)时,就可以认定上式第二项很小到大小可以忽略不计的程度,此时(15)式成立,如亚洲最大年降水量在印度东北部和孟加拉湾北部的乞拉朋齐(Cherrapunji),年降水量可达11 000 mm,亚洲陆面年均降水700 mm左右,两者比值约006,也接近0,所以以上假设在物理实际中是可以接受的。因此,在第二区间(XA≤X≤XM)的标准化 L概率密度函数变成
f(XS)=f(X-XAX)=14ln(1X-XAX)2(XA≤X≤XM)(16)
理论上上式存在的要求是XMXA。这样在第二区间(XA≤X≤XM),标准化 L概率密度函数变量变成
XS=X-XAX(17)
XS代表标准化变量。
最后有2个区间的标准化 L概率密度函数:
f(XS)=f(X-XAXA)=14ln(1X-XAXA)2(-1≤X-XAXA≤0)(18)
f(XS)=f(X-XAX)=14ln(1X-XAX)2(0≤X-XAX≤1)(19)
(18)式是针对偏干燥区间的,因为此区间要求X
降雨量作为一个大于零小于某个较大正数的特殊正变量,它在0与均值间应该很集中,大于均值后的变化范围应
该是较大的,这点决定了它大于均值后的分布有长尾现象,或说它的分布是右(正)偏态的,但从图3可看出经过标准化处理,降水量的最大正振幅是+1、最大负振幅是-1,以0点为新的平衡点,所以标准化后,降雨量标准化随机变量的分布就近似趋于对称分布,这是由于随机变量的变化造成的,当一个实际变量被某个正数除后,事实上它的变化区间就被缩短了这个被除数的倍数,如降雨量的变化范围是0~100 mm,假设它的加权均值是20 mm,变化范围被均值所除后,变化范围就变成了0~5(无量纲),所以此番处理后,就具有某种“收尾”效果;加之以距平为新变量,就使得以均值为对称点的分布演变成以0值为对称点的分布了,另外在偏干燥区降雨量距平变量是被均值所除,而在偏湿润区间降雨量距平变量是被大于均值的正数所除,甚至有可能会被降雨量最大值所除,显然均值两侧的收缩速度是不一样的,所以在湿润区间(X>XA)的收尾速度显然大于干旱区间。表明某些偏态分布经过L分布函数的边界条件处理后,偏态分布就不再存在了,说明L分布函数和随机变量标准化处理相结合具有纠偏效应,这点在理论上是非常重要的。
5时间空间中自相对干湿问题及标准
周期波动是地球大气运动中最基本的本质属性,当然由大气运动而产生的降雨自然也秉赋这一周期性,所以由不同时期的降水量这一随机量所构成的随机时间系列,自然也会体现出某个时段多雨、某些时段少雨的特性,那么多雨多到什么程度、少雨又少到水平,通常这得与降雨量的历史平均值相比,如气象部门通常以30年平均值为比较基础。同样,就一个特定区域,如亚洲每个国家、每个地区,甚至每个城市年降雨量都不同,这样在空间里也构成一降雨量空间集,同样也需要计算出一个空间平均值,如亚洲年降雨量的空间平均值就约多于700 mm,通常大于均值可认为在亚洲气候为偏湿润,小于均值可认为在亚洲气候为偏干燥,就常识可以这样处理,但作为专业而言,一个地区的气候干燥到什么程度、一个地区的气候湿润到什么水平,这就需要从理论上进行分级,制定出标准。笔者在此利用随机变量发生概(几)率的大小,并以此为依据进行划分,基本思想是:随机变量在其均值附近的几率大于远离均值的几(概)率,同时“随机标准化降雨量”处在均值附近就表明该时段或该地区气候的干湿接近平衡,或叫气候不干也不湿,这是个大概率事件,而“随机标准化降雨量”很远离均值就是小概率事件,如小于均值并很大程度上同时远离均值,则就是小概率极端干旱事件,反之,大于均值并在很大程度上远离均值,则就是小概率极端湿润(洪涝)事件。 “标准化降雨量”在任意区间概率:
当-1≤X-XAXA≤0(0≤X≤XA),在偏干燥区间中有
P(XS1
X1-XAXA
ln1X1-XAXA2+2X1-XAXA
( 20 )
当0≤X-XAX≤1(XA≤X≤XM),在偏湿润区间中有
P(XS1
X1-XAX1
ln1X1-XAX12+2X1-XAX1
(21)
通过(20)、(21)式计算,在1倍均方根、2倍均方根、3倍均方根范围内的概率分别为:
P(-1/3
已知 ∞>X-XAXA>23,求XAX
从上式可得
∞>XXA-1>23
不等号两侧同时加1后有
∞>XXA>53
分子分母对调位置
0
另外在表1的基础上,对每个区间又等分,如对0.33~
0、1/3~0、2/6~0等分后变成2个对等区间:2/6~1/6、1/6~0那么6个等级就将变成12个等级(表2)。并用L分布计算出相应的区间概率大小列入表2从右数第1栏。
将表2中从右数的第6栏即标准化干旱指数(X-XA)/XA与台站现行使用的降水距平百分率(表3)的大小相比较,发现表2中的“微干旱﹑微湿润﹑轻度干旱﹑轻度湿润”这4栏的降水百分率为-33%~33%,刚好在一个正负L分布函数的均方差之间,与表3中现行标准的“正常”(4级)的±25%接近,此处应强调由于L分布比正态分布在均值附近更集中,所以一个正负均方差区间的代表性更好,这样-33%~33%被划分为正常区间更为合理。而表2中在正负一个L分布函数的均方差与2个均方差之间(-33%~-67%、33%~67%),即表2中的“中等偏弱湿润和中等偏强湿润,中等偏弱干旱和中等偏强干旱”等级与表3中的轻涝轻旱接近;而表2中的严重湿润和严重干旱与表3中的中旱中涝接近;最后,表2中的超级干旱或超级湿润与表3中的重旱和重涝接近。这里值得指出的是,当然作为一个新的创新方法,表2中的自相对干湿等级无疑是需要进一步验证的,以期与自然实际更加接近,并以满足实际工作需要,但作为一个新的创新所制定的干湿等级理论和方法,首先在理论上进行一些基础性的讨论是完全必要的,同时也不可否认即便是现在正在使用的标准,由于我国地大辽阔、气候地区差异大,每地都有其一定的特殊性,现在正在使用的标准在各地应用情况也不完全一样,有些地区甚至对国家降水距平百分率所划分的干旱标准还要根据当地的具体情况做出一定的修正,所以就这点来说,从新的理论、不同的理论角度,探索不同的干湿理论标准意义重大,特别是当今在全球气候变暖大背景下更有其特殊的意义,至少来说可以作为现有(正在使用)标准和一些特殊地区气候的参考干湿标准也是可行的,甚至仅作为理论来讨论,这也不失一般意义下的创新实践。
正均方根点(1/3)和负均方根点(-1/3)是L分布0-1标准函数中2个最重要的关键点,它们是L分布性质产生质变的关键分界点,两点之间的区间是该分布的主体或主流,其发生概率高达70%,而两点之外,分布就渐渐过渡到小概率落区,至少可以定义成非主体或非主流。所以分析这两点的性质是有意义的,具体详见表4。
6小结与讨论
就气象干旱而言一般应有两类,一是半永久性干旱,如非洲的撒哈拉沙漠;二是气候波动性的阶段式干旱,如云南省2012和2013年冬春连旱;前者的空间属性较大,后者的时间属性较大,所以该研究对“时空自相对干湿”分析事实上是涵盖了这两类干旱。另外应该强调表1~2的自相对干湿标准比较适合在均值附近比较集中的降雨量时空随机变量,原
因有二方面:①L分布函数在一个正负均方差之间的发生概率是70%,而正态分布在一个正负均方差之间的发生概率仅是68%,另外,L分布函数的峰度系数是0.24,而正态分布的峰度系数是0,说明L分布函数在均值附近更为集中,从而决定了L分布函数对处理在均值附近较为集中的随机变量比正态分布更为合适;②对L分布函数中的随机自变量在引入标准化时空自变量后,就发现标准化时空自变量在干湿区间由于概率分布密度函数的边界条件不同,就产生了被除数的不同,即干区间和湿区间收尾速度不一致的问题,显然湿区间的收尾是快的,这保证了降雨量由下界大于0上界不确定的右偏态性质向以0点为平衡点的对称态转变,其实,标准化时空自变量的分母有点类似于“尺度参数”,而均值有点类似于“位置参数”,所以从该研究的实践来看,不能低估类似L分布函数等对称性分布函数(如正态分布),在处理类似降雨量等右偏态变化及等级的能力,右偏态问题用L分布函数处理是合适的,因为L分布函数自变量是在正负最大振幅间活动,即自变量是有界的,且在最大正负振幅这两点的L分布概率密度大小正好为0,所以,利用这个重要的边界条件,就决定出标准化时空自变量存在两类分母(尺度参数),从而决定了干区间和湿区间收缩速度不一样,湿区间收尾速度明显快于干区间的收尾速度,即右侧收缩快于左侧,而这一点正是L分布优越于正态分布的地方,因为正态分布两侧是无界的,用自变量趋于正负∞,决定不出标准化时空自变量的分母,事实上正态分布的尺度参数(分母)刚好是它的均方根,一旦固定这就是一个不变常数,所以用正态分布处理降水距平百分率 时,两侧收缩速度就会一致,这点也正是有些学者质疑正态分布在处理偏态降雨量的不恰当之处,即降水距平百分率的理论基础不牢固的关键所在,即认为降水量分布是右(正)偏态的,而降水距平百分率却是从正态分布推出来的。但从该研究的实践来看尽管L分布函数和正态分布函数都是对称性分布,但L分布函数自变量两端有界,这是一个非常重要的性质,它可作为一个非常重要的边界条件来利用,从而使标准化变量在湿润区和干旱区产生2个不同的分母,这就决定了湿润区间收尾速度快于干旱区,使其右偏态能向对称态转变(纠偏效应),从而解决降雨量右(正)偏态分布的问题,最后为目前台站正在使用的降水距平百分率
(干旱指数)提供了基础理论方面的支持,即降水距平百分率
的理论基础是可信的。总之,应强调正态分布由于自变量在两端取值无界,所以在决定标准化变量的分母时就没有L分布那样方便有力。
在使用表2时应注意,虽然标准化湿润指数(X-XA)/X和标准化干旱指数(X-XA)/XA 所划分干湿等级的区间基本一致,但物理含义是不同的,如在湿润区间当标准化湿润指数(X-XA)/X等于标准化干旱指数(X-XA)/XA时,虽然两指数的分子形式完全一样,但标准化湿润指数的分子明显大于标准化干旱指数的分子,即标准化湿润指数所描述的降水量大于历史均值的程度明显大于标准化干旱指数所描述的降水量大于历史均值的程度,如当标准化湿润指数(X-XA)/X和标准化干旱指数(X-XA)/XA 均等于L分布的一个均方差1/3时,计算得出标准化湿润指数(X-XA)/X所对应的距平大小是标准化干旱指数(X-XA)/XA所对应的距平大小的1.5倍。说明从理论严谨的角度,在湿润区只能用标准化湿润指数(X-XA)/X,即指数的分母必须是降水量X,而在干旱区只能用标准化干旱指数(X-XA)/XA,即指数的分母必须是历史降水量均值XA,这样,降水距平百分率的变化空间便是从-100%变到100%。对于降水距平百分率,在湿润区间(X>XA)降水距平百分率的分母一定要把历史均值换成降水量,只有在这一条件下,目前气象台站正在使用的降水距平百分率才能从-100%变化到100%,显然此时的降水距平百分率就类似正态形状,并对称于0点,所划分的干湿物理意义也更加明确,也具有将降水量从偏态分布向正态分布的转变,所以降水距平百分率只要在干湿两区间对分母区别对待,理论上便是可行合理的。最后,由于篇幅限制未深入进行个例或同类方法的比较研究,其理论特点或优越性待另文再作评估或待实践中去检验。
参考文献
[1] 张强,鞠笑生,李淑华.三种干旱指标的比较和新指标的确定[J].气象科技,1998(2):48-52.
[2] 任福民,史久恩.我国干旱半干旱区降水的特征分析[J].应用气象学报,1995(4):501-504.
[3] 叶天舒,钱忠华,余景华,等.三种干旱指数在云南省的适用性分析[J].扬州大学学报(自然科学版),2013,16(3):41-46.
[4] 马柱国,符淙斌.中国北方干旱区地表湿润状态的趋势分析[J].气象学报,2001,59(6):737-746.
[5] 王劲松,郭江勇,周跃武,等.干旱指标研究的进展与展望[J].干旱区地理,2007(1):60-65.
[6] 毛飞,孙涵,杨红龙.干湿气候区划研究进展[J].地理科学进展,2011,30(1):17-26.
[7] WILLMOTT C,FEDDEMA J J.气候干湿指数的改进[J].干旱区地理,1993,16(3):90-92.
[8] 国家标准化管理委员会.中华人民共和国国家标准:干旱气候等级(征求意见稿)[A].2010-02-18.
[9] 王万里,谢应齐.L分布函数与相对干湿的一种理论标准[J].安徽农业科学,2014(21):7145-7148.
[10] 王万里,刘耀林,蔡述明,等.L分布函数在“0.6测量法”中的应用[C]//中国环境科学学会.2010年中国环境科学学会学术年会论文集(第四集).北京:中国环境科学出版社,2010.
[11] 王万里,王卫国.大气地转静力平衡的方差分析与L分布[J].云南大学学报(自然科学版),2006,28(5):418-424.