论文部分内容阅读
中图分类号:C81文献标识码:A
摘要:稳健统计是数理统计学范畴内的重要概念之一,主要探究当研究对象的总体假定出现变动或数据记录有误等情况时统计适应性的问题,在学科体系中应用性较强。稳健统计的方法不仅在科学研究领域具有十分重要的理论指导意义,同时对政府有关部门在经济政策制定方面具有举足轻重的现实引导作用,因此,对稳健统计在经济指标中应用的探究是具有重要现实意义的问题。基于此,本文就该问题进行了论述,笔者首先简要分析了与稳健统计相关的基础思想,其次以人均收入水平为例对统计稳定性进行了思考,并在此基础上探讨了经济指标中稳健统计的应用问题,旨在促进稳健统计在经济指标中更为深入与全面的应用。
关键词:稳健统计;经济指标;应用;启示
0.引言
在我们平常生活中,我们经常听到人均国民生产总值、人均国内生产总值和人均工资等经济指标的官方统计数据,但往往很多人都会认为相比实际水平而言这些统计数据都会出现偏高的情况,在排除统计误差的情况下,收入分配呈现偏态分布是造成人们对人均经济指标这种理解的主要原因。通常来说,算术平均数在统计中是使用频率较高的经济指标之一,而对平均值的偏离度、分布形态和离群值等因素却考虑较少,这也是造成人们出现“感官高水平”现象的原因之一。相比算术平均数而言,中位数是抗离群值干扰力较强的稳健统计量之一,相较于传统偏重计算程序的统计,稳健统计侧重于分析和揭示数据特征,在一定程度上能反应更真实的情况。
1.关于稳健统计的基础思想
高斯正态分布和最小二乘法的提出为稳健统计的萌芽奠定了基础,在正态分布下均值、众数等统计量具备较高的估计量特性,即便是在对称分布中稍偏态的情况下,这些统计量都具备一定程度的抗离群值能力,另外,被广泛运用的最小二乘估计量与正态分布的整合也具有较好的理论意义。然而在数据分布形态的实际研究表明,标准的正态分布是基于理论假设的,实际生活中数据分布会出现不同程度的偏斜,至多出现近似正态分布状态。对偏离正态假定很敏感的统计方法则不是文件统计的方法。
戈赛特是最早对稳健统计做出理论探讨的人,他发现若实践中人们对数据正态分布的假定不被满足,那么基于该正态分布建立的推断方法的使用价值也值得商榷,它甚至可能推导出错误的结论。在放宽总体分布正态性假定的前提下,对总体分布的描述或判断可以使用中位数等统计量,这也在一定程度上为无确切规定的总体分布函数形式的非参数方法提供了应用空间。然而这类方法的应用却招到了一些批评,主要集中在非参数方法的效率问题,具体指总体在近似分布状态下非参数方法未能实现对分布先验信息有效利用。
2.对统计稳定性的思考——以人均收入水平为例
为了更好的理解统计的稳健性概念,笔者以人均收入水平为例对此进行剖析。在统计中人们对数据分布形态的重视度不够,从而导致平均值存在非正常拔高现象,而算术平均数的计算方法对离群值非常敏感,过多的离群值极易造成平均值失真,统计结果偏离实际情况。因此,算术平均数在该情况并非是好的统计指标,若使用中位数这一统计指标能更真实的反应其统计情况。
为了很好的反映总体情况,对人数收入水平的统计多使用抽样方法。通常人们认为在正态分布假设的前提下只要符合正态分布的要求,统计结果都是有说服力的,然而采集到的样本数量多数并非呈现正态分布,且算数人居收入的大小受到一定程度和数量离群值的影响较大,如20%的高收入人群掌握了社会收入总量的80%,收入分布的复杂性特点是造成传统人均收入算数局限性的重要原因,若仅仅只根据这些数据来推断人均收入水平状况和国民经济是有失偏颇的,严重时甚至会导致政策的错误制定和实施。因此,如何实现稳健的统计方法和统计量是正确认识国民收入分配的关键影响因素。
3.经济指标中稳健统计应用的启示
在上文中,笔者阐述了稳健统计的基础思想,并以人均收入水平为例对统计稳定性进行了探讨,现就此分析经济指标中稳健统计应用问题,具体阐述如下:
3.1 加强对统计量系统化分布的重视程度
统计量系统化分布在官方统计中是较为重要的特征,不仅要加强对统计量系统化分布的重视,还要对各数据信息标注有效解释。比如,对收入分布的位置特征值而言,算数平均收入、中位收入水平等信息可以考虑在解释中给出,另外,基尼系数、劳伦茨曲线等统计量可以对收入分布特征的分布阐述起到辅助作用。尽可能将收入全部观察值划定一定比例做离群值处理并进行专门的分析,数据的主体部分是人均收入指标统计稳健型的主要出发点。
3.2 重视对统计指标中各统计量的对比
比较统计学的提出是统计学界的重要进步之一,它不仅实现了对统计思想、统计流派和统计制度等理论体系的对比,而且还对统计学中的各数据体系、统计量和统计分布等情况进行了比较分析,其中,传统统计量和稳健统计量的差异比较在统计比较研究中具有较高的实用性和直观性。对收入分布的统计研究可以以观察值为依据给出统计量,在排除离群值影响的前提下给出(切尾)统计量。在此基础上分析数据大多数的主体部分和个别的极端部分与统计量之间存在多大程度的关联,以及这两部分数据之间的相互作用关系,还可以进行数据的偏态分析。另外,统计量的比较研究对指标的使用者和数据的分析者更好地理解数据分布特征有积极地促进作用,使他们了解使用稳健统计量的原因。
3.3 合理权衡统计稳健性和敏感性
统计稳健性实际是指统计量与离群值之间具有不强的敏感性,通常运用剔除离群值方法,或以离群值位置代替其他具体数据进行标记以达到稳健统计的目标,这就涉及到统计稳健性和敏感性关系间的权衡问题,统计量不只是一味的求稳健,一定程度的敏感性也是统计优良性的重要表现之一。比如对第一、第二和第三分位数进行简单平均,得出其稳健统计量,需要注意的是该稳健统计量是通过不断逼近的多次迭代求得的,并不是一步就能产生的。因此,合理权衡统计稳健性和敏感性不仅能有效增加统计量的稳健特性,而且还能加强統计量观察值的抽象性。
3.4 统计与计算机技术的结合
在统计变量较少的情况下,传统的手工计算能满足一般的计算要求,然而随着互联网技术的发展,数据和信息资源急速膨胀,对于需要多次迭代求得的稳健统计量而言,计算机技术的运用是不可或缺的。当前,普及度较高的统计软件,如EXCEL、SPSS都为数据分析的发展提供了不可替代的重要作用,而且这也将是未来发展的重要趋势。
4.结束语
综上,稳健统计对国民经济指标的反映具有真实性和全面性,在国民经济统计中应大力推进稳健统计的应用,切实加强对统计量系统化分布的重视程度,对统计稳健性和敏感性进行合理权衡,将统计与计算机技术相结合,同时制定有针对性的方针政策,促进国民经济想更好的方向发展。
参考文献
[1]梁国巍,王传美,童恒庆. 多元统计方法在分析各地区综合经济水平中的应用[J]. 中南民族大学学报(自然科学版). 2009(S1)
[2]钟云燕,贾景智. 中国统计能力测评指标体系的构建[J]. 统计与决策. 2013(22)
[3]郭亚帆,杜金柱. 经典回归与稳健回归方法的应用比较研究[J]. 内蒙古财经学院学报. 2010(04)
[4]连家林. 关于参数统计非参数统计和稳健统计方法的应用[J]. 郑州航空工业管理学院学报. 2010(04)
[5]李成武. 金融稳健统计理论的产生、发展与现状[J]. 统计与决策. 2009(15)
摘要:稳健统计是数理统计学范畴内的重要概念之一,主要探究当研究对象的总体假定出现变动或数据记录有误等情况时统计适应性的问题,在学科体系中应用性较强。稳健统计的方法不仅在科学研究领域具有十分重要的理论指导意义,同时对政府有关部门在经济政策制定方面具有举足轻重的现实引导作用,因此,对稳健统计在经济指标中应用的探究是具有重要现实意义的问题。基于此,本文就该问题进行了论述,笔者首先简要分析了与稳健统计相关的基础思想,其次以人均收入水平为例对统计稳定性进行了思考,并在此基础上探讨了经济指标中稳健统计的应用问题,旨在促进稳健统计在经济指标中更为深入与全面的应用。
关键词:稳健统计;经济指标;应用;启示
0.引言
在我们平常生活中,我们经常听到人均国民生产总值、人均国内生产总值和人均工资等经济指标的官方统计数据,但往往很多人都会认为相比实际水平而言这些统计数据都会出现偏高的情况,在排除统计误差的情况下,收入分配呈现偏态分布是造成人们对人均经济指标这种理解的主要原因。通常来说,算术平均数在统计中是使用频率较高的经济指标之一,而对平均值的偏离度、分布形态和离群值等因素却考虑较少,这也是造成人们出现“感官高水平”现象的原因之一。相比算术平均数而言,中位数是抗离群值干扰力较强的稳健统计量之一,相较于传统偏重计算程序的统计,稳健统计侧重于分析和揭示数据特征,在一定程度上能反应更真实的情况。
1.关于稳健统计的基础思想
高斯正态分布和最小二乘法的提出为稳健统计的萌芽奠定了基础,在正态分布下均值、众数等统计量具备较高的估计量特性,即便是在对称分布中稍偏态的情况下,这些统计量都具备一定程度的抗离群值能力,另外,被广泛运用的最小二乘估计量与正态分布的整合也具有较好的理论意义。然而在数据分布形态的实际研究表明,标准的正态分布是基于理论假设的,实际生活中数据分布会出现不同程度的偏斜,至多出现近似正态分布状态。对偏离正态假定很敏感的统计方法则不是文件统计的方法。
戈赛特是最早对稳健统计做出理论探讨的人,他发现若实践中人们对数据正态分布的假定不被满足,那么基于该正态分布建立的推断方法的使用价值也值得商榷,它甚至可能推导出错误的结论。在放宽总体分布正态性假定的前提下,对总体分布的描述或判断可以使用中位数等统计量,这也在一定程度上为无确切规定的总体分布函数形式的非参数方法提供了应用空间。然而这类方法的应用却招到了一些批评,主要集中在非参数方法的效率问题,具体指总体在近似分布状态下非参数方法未能实现对分布先验信息有效利用。
2.对统计稳定性的思考——以人均收入水平为例
为了更好的理解统计的稳健性概念,笔者以人均收入水平为例对此进行剖析。在统计中人们对数据分布形态的重视度不够,从而导致平均值存在非正常拔高现象,而算术平均数的计算方法对离群值非常敏感,过多的离群值极易造成平均值失真,统计结果偏离实际情况。因此,算术平均数在该情况并非是好的统计指标,若使用中位数这一统计指标能更真实的反应其统计情况。
为了很好的反映总体情况,对人数收入水平的统计多使用抽样方法。通常人们认为在正态分布假设的前提下只要符合正态分布的要求,统计结果都是有说服力的,然而采集到的样本数量多数并非呈现正态分布,且算数人居收入的大小受到一定程度和数量离群值的影响较大,如20%的高收入人群掌握了社会收入总量的80%,收入分布的复杂性特点是造成传统人均收入算数局限性的重要原因,若仅仅只根据这些数据来推断人均收入水平状况和国民经济是有失偏颇的,严重时甚至会导致政策的错误制定和实施。因此,如何实现稳健的统计方法和统计量是正确认识国民收入分配的关键影响因素。
3.经济指标中稳健统计应用的启示
在上文中,笔者阐述了稳健统计的基础思想,并以人均收入水平为例对统计稳定性进行了探讨,现就此分析经济指标中稳健统计应用问题,具体阐述如下:
3.1 加强对统计量系统化分布的重视程度
统计量系统化分布在官方统计中是较为重要的特征,不仅要加强对统计量系统化分布的重视,还要对各数据信息标注有效解释。比如,对收入分布的位置特征值而言,算数平均收入、中位收入水平等信息可以考虑在解释中给出,另外,基尼系数、劳伦茨曲线等统计量可以对收入分布特征的分布阐述起到辅助作用。尽可能将收入全部观察值划定一定比例做离群值处理并进行专门的分析,数据的主体部分是人均收入指标统计稳健型的主要出发点。
3.2 重视对统计指标中各统计量的对比
比较统计学的提出是统计学界的重要进步之一,它不仅实现了对统计思想、统计流派和统计制度等理论体系的对比,而且还对统计学中的各数据体系、统计量和统计分布等情况进行了比较分析,其中,传统统计量和稳健统计量的差异比较在统计比较研究中具有较高的实用性和直观性。对收入分布的统计研究可以以观察值为依据给出统计量,在排除离群值影响的前提下给出(切尾)统计量。在此基础上分析数据大多数的主体部分和个别的极端部分与统计量之间存在多大程度的关联,以及这两部分数据之间的相互作用关系,还可以进行数据的偏态分析。另外,统计量的比较研究对指标的使用者和数据的分析者更好地理解数据分布特征有积极地促进作用,使他们了解使用稳健统计量的原因。
3.3 合理权衡统计稳健性和敏感性
统计稳健性实际是指统计量与离群值之间具有不强的敏感性,通常运用剔除离群值方法,或以离群值位置代替其他具体数据进行标记以达到稳健统计的目标,这就涉及到统计稳健性和敏感性关系间的权衡问题,统计量不只是一味的求稳健,一定程度的敏感性也是统计优良性的重要表现之一。比如对第一、第二和第三分位数进行简单平均,得出其稳健统计量,需要注意的是该稳健统计量是通过不断逼近的多次迭代求得的,并不是一步就能产生的。因此,合理权衡统计稳健性和敏感性不仅能有效增加统计量的稳健特性,而且还能加强統计量观察值的抽象性。
3.4 统计与计算机技术的结合
在统计变量较少的情况下,传统的手工计算能满足一般的计算要求,然而随着互联网技术的发展,数据和信息资源急速膨胀,对于需要多次迭代求得的稳健统计量而言,计算机技术的运用是不可或缺的。当前,普及度较高的统计软件,如EXCEL、SPSS都为数据分析的发展提供了不可替代的重要作用,而且这也将是未来发展的重要趋势。
4.结束语
综上,稳健统计对国民经济指标的反映具有真实性和全面性,在国民经济统计中应大力推进稳健统计的应用,切实加强对统计量系统化分布的重视程度,对统计稳健性和敏感性进行合理权衡,将统计与计算机技术相结合,同时制定有针对性的方针政策,促进国民经济想更好的方向发展。
参考文献
[1]梁国巍,王传美,童恒庆. 多元统计方法在分析各地区综合经济水平中的应用[J]. 中南民族大学学报(自然科学版). 2009(S1)
[2]钟云燕,贾景智. 中国统计能力测评指标体系的构建[J]. 统计与决策. 2013(22)
[3]郭亚帆,杜金柱. 经典回归与稳健回归方法的应用比较研究[J]. 内蒙古财经学院学报. 2010(04)
[4]连家林. 关于参数统计非参数统计和稳健统计方法的应用[J]. 郑州航空工业管理学院学报. 2010(04)
[5]李成武. 金融稳健统计理论的产生、发展与现状[J]. 统计与决策. 2009(15)