论文部分内容阅读
(中南财经政法大学统计与数学学院,湖北 武汉 430073)
摘 要:根据英国《金融时报》报道和英国石油公司(BP)的《世界能源统计年鉴》显示,2010年,中国已超过美国成为世界上最大的能源消费国,而全球能源消费增速也达到1973年以来的最高水平。因此,对能源消耗的问题研究有重要的意义。从能源消费影响因素看,一国能源消费与该国人口数量、GDP和所处纬度均呈显著正相关,鉴于人口和能源消费关系的研究颇多,主要对人均生活能源消费和人均GDP的关系进行研究。对两者关系采用了普遍的最小二乘法和探索性数据分析中的三组耐抗线方法进行对比得出相关关系。
关键词:人均生活能源消费;AGDP;OLS;三组耐抗线
中图分类号:C93 文献标识码:A文章编号:1672-3198(2011)17-0046-02
1 问题提出
能源是人类赖以生存和发展的重要物质基础。在某种意义上讲,人类社会的发展离不开优质能源的出现和先进能源技术的使用。在当今世界,能源的发展,能源和环境,是全世界、全人类共同关心的问题,也是中国社会经济发展的重要问题。但是,人类在享受能源带来的经济发展、科技进步等利益的同时,也遇到一系列无法避免的能源安全挑战,能源短缺、资源争夺以及过度使用能源造成的环境污染尤其是能源利用等问题威胁着人类的生存与发展。
能源消费总量是指一定时期内,全国各行业和居民生活消费的各种能源的总和。该指标是观察能源消费水平、构成和增长速度的总量指标。能源消费总量包括原煤和原油及其制品、天然气、电力,不包括低热值燃料、生物质能和太阳能等的利用。能源消费总量分为终端能源消费量、能源加工转换损失量和能源损失量三部分。
人均生活能源消费量是根据煤炭、电力、煤油、液化石油气、天然气、煤气这几种生活能源的消费总和换算成千克标准煤后的结果。它是反应每人对生活能源的消耗。
国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、政府支出和净出口额。用公式表示为:GDPCA+I+CB+X 式中:CA为消费、I为私人投资、 CB为政府支出、X为净出口额。
人均国内生产总值(Real GDP per capita),也称作“人均GDP",常作为 发展经济学中衡量经济发展状况的指标,是重要的宏观经济指标之一,它是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具。将一个国家核算期内(通常是一年)实现的国内生产总值与这个国家的常住人口(目前使用户籍人口)相比进行计算,得到人均国内生产总值。是衡量各国人民生活水平的一个标准,为了更加客观的衡量,经常与购买力平价结合。
随着经济快速增长,中国能源供给和需求呈现较快增长态势。从能源消费水平看,虽然能源消费总量较大,但人均能源消费量较低,基于购买力平价的单位GDP能源消耗并不高,单位能源消耗GDP产出的增速较快。从能源消费结构看,与世界主要国家和地区相比,中国工业能源消费占比偏高,而交通能源消费占比偏低,近年来生活能源消费占比明显提高。从能源消费影响因素看,一国能源消费与该国人口数量、GDP和所处纬度均呈显著正相关,本文主要对人均生活能源消费和人均GDP的关系进行研究。
2 数据来源及简单分析
相关数据来源于统计局发行的《2009年国家统计年鉴》,针对能源和GDP增长的研究,笔者从中选取了1990-2007年的人均GDP和平均每人生活消费能源的量。笔者发现,随着人均GDP的不断增长,平均每人生活消费能源在大体上也呈现增长的趋势。首先对两组数据进行简单的图形和线性分析。
通过简单绘制由图1我们可以发现平均每人生活消费能源关于人均国内生产总值的散点图,我们可以通过散点图观察发现两者间存在着某种线性关系,则猜测平均每人生活消费能源与人均GDP有着密切联系,还有待下文的进一步研究与探讨。通过绘制平均每人生活消费能源和人均国内生产总值这两个箱线图对比我们可知,人均GDP分别比较均匀,没有明显的左右偏态,而平均每人生活能源数据左偏,并且有两个明显的离群值。两个离群值分别为2006年和2007年这两年的平均每人生活能源数据,笔者认为,应该是由于科学技术不断地进步而导致的人们生活水平和质量提高而导致的。最后我们通过对平均每人生活消费能源与人均国内生产总值的简单线性分析可知,平均每人生活消费能源与人均GDP间的相关系数为0.828,P值0.000符合假设检验的条件,有着比较良好好的拟合。但因为我们无法很正确的判断两者的数据分布情况,突出严谨性,所以我们尝试数据变换。
3 数据变换
数据变换可保持其批中数据的次序,保持一个批的字母值,不计由于数据点之间作内插造成的小差异,保证原始批中非常靠近的点,在重新表达后批中也非常靠近,至少相对于新尺度很靠近,保证函数没有尖锐的拐角,并且由初等函数来规定,以便差不多用最简单的手持计算器就可以快而方便地做重新表达。
下面是对人均GDP进行图形变换,采用了以十为底和以自然数e为底的对数变换和平方根和四次方根变换。
表1
注:模型1为以十为底的对数变换,模型2为以自然数e为底的对数变换模型3为平方根变换,模型4为四次方根变换。
由对比分析可知,以十为底、以自然数e为底的对数变换和平方根、四次方根变换后的相关系数并没有增大反而减少了,均小于原来没有变换前的相关系数0.828。从而笔者采取原来没有变换过的数据进行统计回归分析。
4 最小二乘法(OLS)与三组耐抗线比较
4.1 最小二乘法
根据相关数据采用相关统计软件进行最小二乘回归分析,我们可以得到,最小二乘法最后所得的模型为:
y112.381+0.004x(其中,y为平均每人生活消费能源,x为人均GDP)
4.2 三组耐抗线
探索性数据分析中,我们广泛的用残差图提示对于拟合的改进,察看这技术如何对数据起作用给出拟合,以及描写这拟合的适当性。探索性方法,以对于误差较弱的要求,用稳健耐抗性方法。耐抗性技术被用来揭露和放大数据中的模式。这些模式不是选择模型时事先预料到的,而是部分的取决于所用的分析技术。
首先将18年的数据按照人均GDP从小到大排列,我们可以发现表1的自变量人均GDP已是从小到大排列。由于18可以被3整除,并且x值没有等值结,三个组的每个包含6个数据点。则三个组内的总括点是:
4.3 残差分析
拟合,一般不能完全的描述数据。我们可以用残差逐步地改进拟合,通过用重新表达,用新增变量,以及用特别处理异常数据点。通过上两部分的计算说明,笔者发现最小二乘法拟合的线性关系y112.381+0.004x与三组耐抗线拟合的线性关系y141.776+3.7857×10-3x并没有明显的区别,只是在截距上有些许区别。所以我们可以通过绘制最小二乘法和三组耐抗线的残差图进一步比较两个方法针对本论题的优劣性。
如图1,对比最小二乘法和三组耐抗线的残差,笔者发现,虽然两个残差图很相似,但是三组耐抗线的残差的布局往下些,这说明,如果从中移掉四个负斜率的直线后,最小二乘法德残差看起来会更水平些。
5 进一步研究
然而,我们不难发现新的拟合过程的残差呈线性关系,可能是数据的误差和前几年收集统计数据的方法不够完善,相互的关系还有待进一步的研究和探讨。
表2
参考文献
[1]Wendy L.Martinez,Angel R.Martinez,《Exploratory Data Analysis with Matlab》,2005 by Chapman & Hall/CRC Press.
[2]陈忠琏,郭德媛译,杨振海校,探索型数据分析[M].北京:中国统计出版社出版.
[3]吴国培,吴伟.中国能源消费现状及影响因素[J].中国金融,2011,(8).
摘 要:根据英国《金融时报》报道和英国石油公司(BP)的《世界能源统计年鉴》显示,2010年,中国已超过美国成为世界上最大的能源消费国,而全球能源消费增速也达到1973年以来的最高水平。因此,对能源消耗的问题研究有重要的意义。从能源消费影响因素看,一国能源消费与该国人口数量、GDP和所处纬度均呈显著正相关,鉴于人口和能源消费关系的研究颇多,主要对人均生活能源消费和人均GDP的关系进行研究。对两者关系采用了普遍的最小二乘法和探索性数据分析中的三组耐抗线方法进行对比得出相关关系。
关键词:人均生活能源消费;AGDP;OLS;三组耐抗线
中图分类号:C93 文献标识码:A文章编号:1672-3198(2011)17-0046-02
1 问题提出
能源是人类赖以生存和发展的重要物质基础。在某种意义上讲,人类社会的发展离不开优质能源的出现和先进能源技术的使用。在当今世界,能源的发展,能源和环境,是全世界、全人类共同关心的问题,也是中国社会经济发展的重要问题。但是,人类在享受能源带来的经济发展、科技进步等利益的同时,也遇到一系列无法避免的能源安全挑战,能源短缺、资源争夺以及过度使用能源造成的环境污染尤其是能源利用等问题威胁着人类的生存与发展。
能源消费总量是指一定时期内,全国各行业和居民生活消费的各种能源的总和。该指标是观察能源消费水平、构成和增长速度的总量指标。能源消费总量包括原煤和原油及其制品、天然气、电力,不包括低热值燃料、生物质能和太阳能等的利用。能源消费总量分为终端能源消费量、能源加工转换损失量和能源损失量三部分。
人均生活能源消费量是根据煤炭、电力、煤油、液化石油气、天然气、煤气这几种生活能源的消费总和换算成千克标准煤后的结果。它是反应每人对生活能源的消耗。
国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、政府支出和净出口额。用公式表示为:GDPCA+I+CB+X 式中:CA为消费、I为私人投资、 CB为政府支出、X为净出口额。
人均国内生产总值(Real GDP per capita),也称作“人均GDP",常作为 发展经济学中衡量经济发展状况的指标,是重要的宏观经济指标之一,它是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具。将一个国家核算期内(通常是一年)实现的国内生产总值与这个国家的常住人口(目前使用户籍人口)相比进行计算,得到人均国内生产总值。是衡量各国人民生活水平的一个标准,为了更加客观的衡量,经常与购买力平价结合。
随着经济快速增长,中国能源供给和需求呈现较快增长态势。从能源消费水平看,虽然能源消费总量较大,但人均能源消费量较低,基于购买力平价的单位GDP能源消耗并不高,单位能源消耗GDP产出的增速较快。从能源消费结构看,与世界主要国家和地区相比,中国工业能源消费占比偏高,而交通能源消费占比偏低,近年来生活能源消费占比明显提高。从能源消费影响因素看,一国能源消费与该国人口数量、GDP和所处纬度均呈显著正相关,本文主要对人均生活能源消费和人均GDP的关系进行研究。
2 数据来源及简单分析
相关数据来源于统计局发行的《2009年国家统计年鉴》,针对能源和GDP增长的研究,笔者从中选取了1990-2007年的人均GDP和平均每人生活消费能源的量。笔者发现,随着人均GDP的不断增长,平均每人生活消费能源在大体上也呈现增长的趋势。首先对两组数据进行简单的图形和线性分析。
通过简单绘制由图1我们可以发现平均每人生活消费能源关于人均国内生产总值的散点图,我们可以通过散点图观察发现两者间存在着某种线性关系,则猜测平均每人生活消费能源与人均GDP有着密切联系,还有待下文的进一步研究与探讨。通过绘制平均每人生活消费能源和人均国内生产总值这两个箱线图对比我们可知,人均GDP分别比较均匀,没有明显的左右偏态,而平均每人生活能源数据左偏,并且有两个明显的离群值。两个离群值分别为2006年和2007年这两年的平均每人生活能源数据,笔者认为,应该是由于科学技术不断地进步而导致的人们生活水平和质量提高而导致的。最后我们通过对平均每人生活消费能源与人均国内生产总值的简单线性分析可知,平均每人生活消费能源与人均GDP间的相关系数为0.828,P值0.000符合假设检验的条件,有着比较良好好的拟合。但因为我们无法很正确的判断两者的数据分布情况,突出严谨性,所以我们尝试数据变换。
3 数据变换
数据变换可保持其批中数据的次序,保持一个批的字母值,不计由于数据点之间作内插造成的小差异,保证原始批中非常靠近的点,在重新表达后批中也非常靠近,至少相对于新尺度很靠近,保证函数没有尖锐的拐角,并且由初等函数来规定,以便差不多用最简单的手持计算器就可以快而方便地做重新表达。
下面是对人均GDP进行图形变换,采用了以十为底和以自然数e为底的对数变换和平方根和四次方根变换。
表1
注:模型1为以十为底的对数变换,模型2为以自然数e为底的对数变换模型3为平方根变换,模型4为四次方根变换。
由对比分析可知,以十为底、以自然数e为底的对数变换和平方根、四次方根变换后的相关系数并没有增大反而减少了,均小于原来没有变换前的相关系数0.828。从而笔者采取原来没有变换过的数据进行统计回归分析。
4 最小二乘法(OLS)与三组耐抗线比较
4.1 最小二乘法
根据相关数据采用相关统计软件进行最小二乘回归分析,我们可以得到,最小二乘法最后所得的模型为:
y112.381+0.004x(其中,y为平均每人生活消费能源,x为人均GDP)
4.2 三组耐抗线
探索性数据分析中,我们广泛的用残差图提示对于拟合的改进,察看这技术如何对数据起作用给出拟合,以及描写这拟合的适当性。探索性方法,以对于误差较弱的要求,用稳健耐抗性方法。耐抗性技术被用来揭露和放大数据中的模式。这些模式不是选择模型时事先预料到的,而是部分的取决于所用的分析技术。
首先将18年的数据按照人均GDP从小到大排列,我们可以发现表1的自变量人均GDP已是从小到大排列。由于18可以被3整除,并且x值没有等值结,三个组的每个包含6个数据点。则三个组内的总括点是:
4.3 残差分析
拟合,一般不能完全的描述数据。我们可以用残差逐步地改进拟合,通过用重新表达,用新增变量,以及用特别处理异常数据点。通过上两部分的计算说明,笔者发现最小二乘法拟合的线性关系y112.381+0.004x与三组耐抗线拟合的线性关系y141.776+3.7857×10-3x并没有明显的区别,只是在截距上有些许区别。所以我们可以通过绘制最小二乘法和三组耐抗线的残差图进一步比较两个方法针对本论题的优劣性。
如图1,对比最小二乘法和三组耐抗线的残差,笔者发现,虽然两个残差图很相似,但是三组耐抗线的残差的布局往下些,这说明,如果从中移掉四个负斜率的直线后,最小二乘法德残差看起来会更水平些。
5 进一步研究
然而,我们不难发现新的拟合过程的残差呈线性关系,可能是数据的误差和前几年收集统计数据的方法不够完善,相互的关系还有待进一步的研究和探讨。
表2
参考文献
[1]Wendy L.Martinez,Angel R.Martinez,《Exploratory Data Analysis with Matlab》,2005 by Chapman & Hall/CRC Press.
[2]陈忠琏,郭德媛译,杨振海校,探索型数据分析[M].北京:中国统计出版社出版.
[3]吴国培,吴伟.中国能源消费现状及影响因素[J].中国金融,2011,(8).